OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 启梦行动 > 讲座沙龙 > EngineClub > 2021 > 主题分享 >

大模型压缩方法在云脑2的实现

  • 发布时间:2024-04-19

2021年10月27日-第15场技术讲座

讲座题目:大模型压缩方法在云脑2的实现
分享人:易泽轩
分享人介绍:中国传媒大学通信与信息系统硕士毕业,现于鹏城实验室大模型研究子课题工作,负责大模型的在线推理部署和并行算法优化。联系邮箱:yizx@pcl.ac.cn
内容介绍:
炼大模型的时代,如GPT-3、AlphaFold等超大规模模型的规模迅速增长,大模型成功的背后是庞大数据和算力的支持。很多研究工作者和企业没有充足的算力来部署巨额参数量模型,急需将大模型压缩,得到精度相当,部署条件相对简易的压缩模型,以加速模型的应用落地。本次分享将介绍大规模预训练语言模型压缩相关方法,包括量化、剪枝、蒸馏等,以及在云脑2压缩大模型的工程实现,为得到易于部署的压缩模型提供思路和技术方案。

更多技术讲座和课件下载,请访问EngineClub项目地址