微软开源 DeepSpeed Chat
2023-4-13 23:27:33 Author: www.solidot.org(查看原文) 阅读量:16 收藏

  • 文章
  • 皮肤

开源 微软

Wilson (42865)发表于 2023年04月13日 23时27分 星期四
来自华龙之宫

微软开源了 DeepSpeed Chat,帮助用户加速训练类似于 ChatGPT 的模型。DeepSpeed Chat 能够简化 ChatGPT 类型模型的训练过程、强化推理体验。其中的 DeepSpeed-RLHF 系统能够在推理和训练两种模式之间进行切换,使复杂的 RLHF 训练速率更快、易于大规模推广。DeepSpeed-HE 比现有系统快 15 倍以上,且成本更低。在微软云 Azure 上,该系统只需 9 小时即可训练一个 OPT-13B 模型,只需 18 小时即可训练一个 OPT-30B 模型,且这两种训练分别花费不到 300 美元和 600 美元。

https://github.com/microsoft/DeepSpeed/blob/master/blogs/deepspeed-chat/README.md
https://news.sciencenet.cn/htmlnews/2023/4/498432.shtm




文章来源: https://www.solidot.org/story?sid=74661
如有侵权请联系:admin#unsafe.sh