OpenI 启智社区

启智社区,确实给力

openMind 开源实习

进入协作平台

openMind开源实习是OpenI启智社区携手openMind Library工具链专门开设的系列线上实习项目,旨在鼓励高校在读学生积极参与开源贡献,在实际的开源环境中提升实践能力。首期开源实习项目时间为2024年10月15日至2024年12月31日,历时10周,实习期间将不定期邀请部分贡献积极的实习生参加线下集训。

本期开源实习项目将面向高校在校生提供系列开源实习任务。学生通过实习申请后,可在启智社区领取任务并基于昇腾算力资源完成相应任务,主要分为大模型任务和算子开发任务,每完成一个任务可获得相应奖励。在实习结束后,可获得由OpenI社区提供的实习证明。

实习流程

1. 实习申请:

本期开源实习活动时间为2024年10月15日至2024年12月31日,要求实习时间不低于1个月,即最晚提交实习申请时间应在2024年11月30日前。

1、参加芯动开源-openMind专场,并完成20个基础模型迁移和1个TOP50海外大模型调优任务。
2、阅读并手写签署活动声明(见申请材料模板里)。
3、在线填写报名资料表,需上传扫描版签名文件至在线表单,填写完毕后等待审核,组织方将以邮件反馈审核结果。审核通过后,双方签订劳务协议后开始实习。
4、参与线上实习的学生,优秀学生可获得2025年线下实习的机会。

2. 领取任务:

1、实习生在开源实习活动页面或openMind项目Issue区查看和申请任务,由官方发放实习生发放任务。
2、每位实习生每次仅能认领1个任务,当任务完成后方可继续认领任务。
3、如果领取后无法完成,需在任务完成截止日期前,向官方请求更换任务。

3. 提交任务:

1、在任务指定完成时间内处理完成后,向官网提交验收报告。
2、官方对验收报告进行验收,验收通过,实习生可获取任务奖励;若验收不通过,在官方技术人员辅导下可继续进行该任务,若在实习结束前仍无法通过验收,实习生将无法获得该任务奖励。

4. 开源实习激励:

实习工资:
实习有效期内完成相应任务,即可获得对应奖励。详见实习任务发布页面(即将上线)。
实习证明:
  1. 实习有效期内至少完成1个任务
  2. 至少找一位导师写实习评语。
  3. 提交实习报告至官方邮箱 secretariat@openi.org.cn。
满足以上3条,实习评语与实习报告经评审合格后发放实习证明。
优秀实习生证书:
  1. 实习有效期内至少完成2个任务。
  2. 至少找一位导师写优秀推荐评语。
  3. 撰写至少一篇openMind技术博客。
  4. 完成优秀实习生线上公开答辩。
满足以上4条,实习评语与实习报告经评审合格后发放实习证明。

实习任务

1.  任务认领

点击链接在线申请认领任务。

1) TOP大模型迁移调优

序号

模型名称

参数量

开源协议

HF链接

1

deepseek-coder-33b-base

33.3B

deepseek-license (other)

https://huggingface.co/deepseek-ai/deepseek-coder-33b-base

2

deepseek-coder-33b-instruct

33.3B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-coder-33b-instruct

3

deepseek-coder-6.7b-base

6.74B

deepseek-license (other)

https://huggingface.co/deepseek-ai/deepseek-coder-6.7b-base

4

deepseek-coder-6.7b-instruct

6.74B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-coder-6.7b-instruct

5

deepseek-coder-7b-instruct-v1.5

6.91B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-coder-7b-instruct-v1.5

6

deepseek-Coder-V2-Lite-Instruct

15.7B

deepseek-license (other)

https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

7

deepseek-math-7b-rl

6.91B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-math-7b-rl

8

deepseek-moe-16b-base

16.4B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-moe-16b-base

9

deepseek-V2-Lite

15.7B

deepseek (other)

https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite

10

deepseek-V2-Lite-Chat

15.7B

deepseek (other)

https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite-Chat

11

deepseek-vl-7b-chat

7.34B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-vl-7b-chat

12

Yi-1.5-34B

34.4B

apache-2.0

https://huggingface.co/01-ai/Yi-1.5-34B

13

Yi-1.5-34B-Chat

34.4B

apache-2.0

https://huggingface.co/01-ai/Yi-1.5-34B-Chat

14

Yi-1.5-9B

8.83B

apache-2.0

https://huggingface.co/01-ai/Yi-1.5-9B

15

Yi-34B

34.4B

apache-2.0

https://huggingface.co/01-ai/Yi-34B

16

Yi-34B-200K

34.4B

apache-2.0

https://huggingface.co/01-ai/Yi-34B-200K

17

Yi-34B-Chat

34.4B

apache-2.0

https://huggingface.co/01-ai/Yi-34B-Chat

18

Yi-6B-200K

6.06B

apache-2.0

https://huggingface.co/01-ai/Yi-6B-200K

19

Yi-6B-Chat

6.06B

apache-2.0

https://huggingface.co/01-ai/Yi-6B-Chat

20

Yi-9B

8.83B

apache-2.0

https://huggingface.co/01-ai/Yi-9B

21

Yi-9B-200K

8.83B

apache-2.0

https://huggingface.co/01-ai/Yi-9B-200K

22

Bunny-Llama-3-8B-V

8.48B

apache-2.0

https://huggingface.co/BAAI/Bunny-Llama-3-8B-V

23

InternLM-XComposer2.5

7B

 

https://huggingface.co/internlm/internlm-xcomposer2d5-7b

24

Qwen1.5-32B

32.5B

tongyi-qianwen-research (other)

https://huggingface.co/Qwen/Qwen1.5-32B

25

Qwen1.5-MoE-A2.7B

14.3B

tongyi-qianwen (other)

https://huggingface.co/Qwen/Qwen1.5-MoE-A2.7B

26

Qwen2-57B-A14B-Instruct

57.4B

apache-2.0

https://huggingface.co/Qwen/Qwen2-57B-A14B-Instruct

27

iFlytekSpark-13B

13B

apache-2.0

https://xihe.mindspore.cn/modelzoo/iflytekspark/introduce

28

JIUTIAN-139MoE

13.9B

-

https://modelscope.cn/models/JiuTian-AI/JIUTIAN-139MoE-chat


2) MindSpeed模型适配任务

序号

模型名称

参数量

开源协议

HF链接

1

deepseek-coder-6.7b-base

6.74B

deepseek-license (other)

https://huggingface.co/deepseek-ai/deepseek-coder-6.7b-base

2

deepseek-math-7b-rl

6.91B

deepseek (other)

https://huggingface.co/deepseek-ai/deepseek-math-7b-rl

3

Yi-6B-200K

6.06B

apache-2.0

https://huggingface.co/01-ai/Yi-6B-200K

4

Yi-6B-Chat

6.06B

apache-2.0

https://huggingface.co/01-ai/Yi-6B-Chat

5

Yi-9B

8.83B

apache-2.0

https://huggingface.co/01-ai/Yi-9B

6

Yi-9B-200K

8.83B

apache-2.0

https://huggingface.co/01-ai/Yi-9B-200K

2.  任务要求

1) TOP大模型任务要求

序号

标准

交付件

1-必须项

功能要求:基于昇腾算力,直接运行提供的微调和推理脚本可跑通

1、跑通截图和日志及配套的单元测试用例(建议用unittest实现)

2-必须项

推理精度:推理结果和GPU或者CPU对齐

1、推理结果截图和日志及配套的单元测试用例(建议用unittest实现)

3-必须项

NPU loss收敛:微调loss有明显下降趋势,5000 step 和GPU平均差异小于2%

1、提供loss下降曲线截图和日志及配套的单元测试用例(建议用unittest实现)
2、提供loss与GPU基线相对误差曲线截图

4-必须项

上传至openMind应用使能套件并开源至启智社区与魔乐社区:
1)启智和魔乐的模型简介不能为空;且简介中需加入openMind使用样例代码;
2)模型标签添加openmind;
3)推理脚本、调优脚本、原始模型、调优后的模型上传至社区,且readme和权重等无问题
4)examples下有推理脚本,不能为空或与模型无关;模型在魔乐社区通过可用性测试

1、模型上传至启智社区与魔乐社区的地址

5-可选项

性能要求:微调性能达到0.7,即单卡吞吐NPU/GPU≥0.7

1、微调截图和日志及配套的单元测试用例(建议用unittest实现)


2) MindSpeed-LLM迁移适配要求

标准

交付件

1、模型上传到启智和魔乐社区

预训练脚本

推理脚本

评估脚本

2、交付报告

模型前后结果余弦相似度截图

预训练脚本链接 + 截图 + 预训练日志

推理脚本链接 + 截图 + 推理日志

评估脚本链接 + 截图 + 评估日志

3.  任务说明

任务类型

任务说明

验收要求

任务奖励

挑战任务-模型类

每人每次可领取1个模型任务,完成即可领取下一个;不重复领取。可通过openMind交流群(可在OpenI启智社区公众号回复“openMind”获取入群二维码)联系管理员进行认领与确认。

1/2/3/4必选, 5 可选

1、满足1/2/3/4,奖励3000元
2、在满足1/2/3/4后,挑战5,+1000元

4.  任务奖励

任务类型

奖励项目

奖励额度

挑战任务完成奖励

TOP大模型迁移调优

3000~4000元/个

MindSpeed迁移适配

3000元/个

算子类

待补充

实习生评优

月度最佳实习生
(当月完成量TOP3)

2000元/人

季度最佳实习生
(季度累计完成量TOP3,TOP1-8000,TOP2-6000,TOP3-3000)

3000~8000元/人

规则说明

开源实习面向全国范围内年满18周岁的全日制/非全日制在校学生招募,无专业年级限制,欢迎感兴趣的同学踊跃报名。

实习有效期最长为10周期限,10周内内未完成实习任务则不能获得实习证明。线上实习时间管理相对自由,可根据自身情况安排时间,可提前结束实习。

活动主办方不对任何因电脑、互联网、移动网络等故障而造成的参与开源实习文件损坏、缺失、提交延时等后果承担责任。

本活动奖金均为税前金额,实际到手奖金以税后为准。

活动主办方保留对活动规则进行调整修改的权利,拥有对本活动的最终解释权。

啥也别说了,赶紧开干!

关注公众号,可别错过奖金~