OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 启梦行动 > 讲座沙龙 > EngineClub > 2022 > 主题分享 >

鹏城·mPanGu-α-53 以中文为中心一带一路多语言机器翻译大模型

  • 发布时间:2024-03-29

2022年4月20日-2022年第8场 总第30场技术讲座

讲座题目:鹏城·mPanGu-α-53 以中文为中心一带一路多语言机器翻译研究进展
分享人:陶恒韬
分享人介绍:武汉邮电科学研究院信号与信息处理硕士,现于鹏城实验室基础技术研究室,负责大模型的并行训练和优化、多语言大模型、可持续学习等。联系邮箱:taoht@pcl.ac.cn
内容介绍:
以鹏城·PanGu α为基础验证Decoder生成式语言模型在多语言翻译上的有效性,构建2TB鹏城53种语言的多语言高质量单双语数据集、2.6B多语言预训练大模型、2.6B一带一路多语言机器翻译大模型,支持单模型53种语言任意两语种间的互译,对比WMT2021多语言任务榜单No.1已覆盖的50种语言“中<->外”100个翻译方向平均BLEU值提升0.354,对比以英文为中心主流M2M2-100、mRASP2、ALM多语言模型“英<->外”翻译方向论文结果BLEU值接近。

更多技术讲座和课件下载,请访问EngineClub项目地址