2024-05-06
吴翼团队在强化学习训练系统抽象层面提出了创新设计方案,自主设计并开发了能够部署在一万个计算核心上进行强化学习的分布式系统SRL。通过创新的数据流抽象和高效的架构设计,在多个核心上实现了可扩展、高效和可扩展的强化学习训练,显著提高了训练吞吐量和学习性能。本系统吞吐量和样本效率能够达到最佳开源系统的21倍,达到OpenAI闭源系统的5倍。
论文标题:SRL: Scaling Distributed Reinforcement Learning to Over Ten Thousand Cores.
论文作者:Zhiyu Mei*, Wei Fu*, Jiaxuan Gao, Guangju Wang, Huanchen Zhang, & Yi Wu
项目链接:https://github.com/openpsi-project/srl