Facebook 开源 ReAgent:用于构建推理系统的模块化端到端平台

ReAgent是用Python构建的,使用PyTorch进行建模和训练,并使用TorchScript进行模型服务。 该平台包含用于训练流行的深度RL算法的工作流,包括数据预处理,功能转换,分布式训练,反事实策略评估和优化服务。