启梦行动

当前位置：首页 > 启梦行动 > 讲座沙龙 > EngineClub > 2021 > 主题分享 >

大模型压缩方法在云脑2的实现

发布时间：2025-07-06

2021年10月27日-第15场技术讲座

讲座题目：大模型压缩方法在云脑2的实现
分享人：易泽轩
分享人介绍：中国传媒大学通信与信息系统硕士毕业，现于鹏城实验室大模型研究子课题工作，负责大模型的在线推理部署和并行算法优化。联系邮箱：yizx@pcl.ac.cn
内容介绍：
炼大模型的时代，如GPT-3、AlphaFold等超大规模模型的规模迅速增长，大模型成功的背后是庞大数据和算力的支持。很多研究工作者和企业没有充足的算力来部署巨额参数量模型，急需将大模型压缩，得到精度相当，部署条件相对简易的压缩模型，以加速模型的应用落地。本次分享将介绍大规模预训练语言模型压缩相关方法，包括量化、剪枝、蒸馏等，以及在云脑2压缩大模型的工程实现，为得到易于部署的压缩模型提供思路和技术方案。

更多技术讲座和课件下载，请访问EngineClub项目地址

启智社区，确实给力

启梦行动

大模型压缩方法在云脑2的实现

2021年10月27日-第15场技术讲座