OpenI 启智社区

启智社区,确实给力

openMind 开源实习

进入协作平台

openMind开源实习是OpenI启智社区携手openMind Library工具链专门开设的系列线上实习项目,旨在鼓励高校在读学生积极参与开源贡献,在实际的开源环境中提升实践能力。首期开源实习项目时间为2024年10月15日至2024年12月31日,历时10周,实习期间将不定期邀请部分贡献积极的实习生参加线下集训。

本期开源实习项目将面向高校在校生提供系列开源实习任务。学生通过实习申请后,可在启智社区领取任务并基于昇腾算力资源完成相应任务,主要分为大模型任务和算子开发任务,每完成一个任务可获得相应奖励。在实习结束后,可获得由OpenI社区提供的实习证明。

NO. 01 开源实习获奖名单

可以按“Ctrl+F”查找

序号 用户 验收通过任务数量 总奖金 称号
1 jiangwewqe 9 40000 12月TOP1 季度TOP1
2 chenzhicheng 4 21000 12月TOP2 季度TOP2
3 ltdog 3 15000 12月TOP3 季度TOP3
4 zyl9737 3 9000    
5 zhy_tju 2 8000    
6 hello1 2 6000    
7 nanluan1 2 6000    
8 yyhhxx 2 6000    
9 ythqwq 1 4000    
10 default_null 1 3000    
11 edgesky 1 3000    
12 Eziotao 1 3000    
13 gaojinpeng 1 3000    
14 xiaohangchi 1 3000    
15 ccpower 1 3000    
16 libo2024 1 3000    
17 flysky 1 3000    

实习流程

1. 实习申请:

本期开源实习活动时间为2024年10月15日至2024年12月31日,要求实习时间不低于1个月,即最晚提交实习申请时间应在2024年11月30日前。

1、参加芯动开源-openMind专场,并完成20个基础模型迁移和1个TOP50海外大模型调优任务。
2、阅读并手写签署活动声明(见申请材料模板里)。
3、在线填写报名资料表,需上传扫描版签名文件至在线表单,填写完毕后等待审核,组织方将以邮件反馈审核结果。审核通过后,双方签订劳务协议后开始实习。
4、参与线上实习的学生,优秀学生可获得2025年线下实习的机会。

2. 领取任务:

1、实习生在开源实习活动页面或openMind项目Issue区查看和申请任务,由官方发放实习生发放任务。
2、每位实习生每次仅能认领1个任务,当任务完成后方可继续认领任务。
3、如果领取后无法完成,需在任务完成截止日期前,向官方请求更换任务。

3. 提交任务:

1、在任务指定完成时间内处理完成后,向官网提交验收报告。
2、官方对验收报告进行验收,验收通过,实习生可获取任务奖励;若验收不通过,在官方技术人员辅导下可继续进行该任务,若在实习结束前仍无法通过验收,实习生将无法获得该任务奖励。

4. 开源实习激励:

实习工资:
实习有效期内完成相应任务,即可获得对应奖励。详见实习任务发布页面(即将上线)。
实习证明:
  1. 实习有效期内至少完成1个任务
  2. 至少找一位导师写实习评语。
  3. 提交实习报告至官方邮箱 secretariat@openi.org.cn。
满足以上3条,实习评语与实习报告经评审合格后发放实习证明。
优秀实习生证书:
  1. 实习有效期内至少完成2个任务。
  2. 至少找一位导师写优秀推荐评语。
  3. 撰写至少一篇openMind技术博客。
  4. 完成优秀实习生线上公开答辩。
满足以上4条,实习评语与实习报告经评审合格后发放实习证明。

实习任务

1.  任务认领

点击链接在线申请认领任务。

1) TOP大模型迁移调优

序号 模型名称 参数量 开源协议
1 deepseek-coder-33b-base 33.3B deepseek-license (other)
2 deepseek-coder-33b-instruct 33.3B deepseek (other)
3 deepseek-coder-6.7b-base 6.74B deepseek-license (other)
4 deepseek-coder-6.7b-instruct 6.74B deepseek (other)
5 deepseek-coder-7b-instruct-v1.5 6.91B deepseek (other)
6 deepseek-Coder-V2-Lite-Instruct 15.7B deepseek-license (other)
7 deepseek-math-7b-rl 6.91B deepseek (other)
8 deepseek-moe-16b-base 16.4B deepseek (other)
9 deepseek-V2-Lite 15.7B deepseek (other)
10 deepseek-V2-Lite-Chat 15.7B deepseek (other)
11 deepseek-vl-7b-chat 7.34B deepseek (other)
12 Yi-1.5-34B 34.4B apache-2.0
13 Yi-1.5-34B-Chat 34.4B apache-2.0
14 Yi-1.5-9B 8.83B apache-2.0
15 Yi-34B 34.4B apache-2.0
16 Yi-34B-200K 34.4B apache-2.0
17 Yi-34B-Chat 34.4B apache-2.0
18 Yi-6B-200K 6.06B apache-2.0
19 Yi-6B-Chat 6.06B apache-2.0
20 Yi-9B 8.83B apache-2.0
21 Yi-9B-200K 8.83B apache-2.0
22 Bunny-Llama-3-8B-V 8.48B apache-2.0
23 InternLM-XComposer2.5 7B  
24 Qwen1.5-32B 32.5B tongyi-qianwen-research (other)
25 Qwen1.5-MoE-A2.7B 14.3B tongyi-qianwen (other)
26 Qwen2-57B-A14B-Instruct 57.4B apache-2.0
27 iFlytekSpark-13B 13B apache-2.0
28 JIUTIAN-139MoE 13.9B -
29 Llama-2-7b-chat-hf 6.74B llama2
30 Meta-Llama-3-8B-Instruct 8.03B llama3
31 Mistral-7B-Instruct-v0.2 7.24B apache-2.0
32 zephyr-7b-beta 7.24B mit
33 Mistral-7B-Instruct-v0.1 7.24B apache-2.0
34 fuyu-8b 9.41B cc-by-nc-4.0
35 OpenHermes-2.5-Mistral-7B 7.24B apache-2.0
36 OLMo-7B 6.89B apache-2.0
37 Starling-LM-7B-alpha 7.24B apache-2.0
38 neural-chat-7b-v3-1 7.24B apache-2.0
39 idefics2-8b 8.4B apache-2.0
40 Mistral-7B-Instruct-v0.1-GGUF 7.24B apache-2.0
41 Hermes-2-Pro-Mistral-7B 7.24B apache-2.0
42 SOLAR-10.7B-Instruct-v1.0 10.7B cc-by-nc-4.0
43 aya-101 12.9B apache-2.0
44 flan-t5-xxl 11.3B apache-2.0

2) MindSpeed模型适配任务

序号 模型名称 参数量 开源协议
1 deepseek-coder-6.7b-base 6.74B deepseek-license (other)
2 deepseek-math-7b-rl 6.91B deepseek (other)
3 Yi-6B-200K 6.06B apache-2.0
4 Yi-6B-Chat 6.06B apache-2.0
5 Yi-9B 8.83B apache-2.0
6 Yi-9B-200K 8.83B apache-2.0

2.  任务要求

1) TOP大模型任务要求

序号

标准

交付件

1-必须项

功能要求:基于昇腾算力,直接运行提供的微调和推理脚本可跑通

1、跑通截图和日志及配套的单元测试用例(建议用unittest实现)

2-必须项

推理精度:推理结果和GPU或者CPU对齐

1、推理结果截图和日志及配套的单元测试用例(建议用unittest实现)

3-必须项

NPU loss收敛:微调loss有明显下降趋势,5000 step 和GPU平均差异小于2%

1、提供loss下降曲线截图和日志及配套的单元测试用例(建议用unittest实现)
2、提供loss与GPU基线相对误差曲线截图

4-必须项

上传至openMind应用使能套件并开源至启智社区与魔乐社区:
1)启智和魔乐的模型简介不能为空;且简介中需加入openMind使用样例代码;
2)模型标签添加openmind;
3)推理脚本、调优脚本、原始模型、调优后的模型上传至社区,且readme和权重等无问题
4)examples下有推理脚本,不能为空或与模型无关;模型在魔乐社区通过可用性测试

1、模型上传至启智社区与魔乐社区的地址

5-可选项

性能要求:微调性能达到0.7,即单卡吞吐NPU/GPU≥0.7

1、微调截图和日志及配套的单元测试用例(建议用unittest实现)


2) MindSpeed-LLM迁移适配要求

标准

交付件

1、模型上传到启智和魔乐社区

预训练脚本

推理脚本

评估脚本

2、交付报告

模型前后结果余弦相似度截图

预训练脚本链接 + 截图 + 预训练日志

推理脚本链接 + 截图 + 推理日志

评估脚本链接 + 截图 + 评估日志

3.  任务说明

任务类型

任务说明

验收要求

任务奖励

挑战任务-模型类

每人每次可领取1个模型任务,完成即可领取下一个;不重复领取。可通过openMind交流群(可在OpenI启智社区公众号回复“openMind”获取入群二维码)联系管理员进行认领与确认。

1/2/3/4必选, 5 可选

1、满足1/2/3/4,奖励3000元
2、在满足1/2/3/4后,挑战5,+1000元

4.  任务奖励

任务类型

奖励项目

奖励额度

挑战任务完成奖励

TOP大模型迁移调优

3000~4000元/个

MindSpeed迁移适配

3000元/个

算子类

待补充

实习生评优

月度最佳实习生
(当月完成量TOP3)

2000元/人

季度最佳实习生
(季度累计完成量TOP3,TOP1-8000,TOP2-6000,TOP3-3000)

3000~8000元/人

规则说明

开源实习面向全国范围内年满18周岁的全日制/非全日制在校学生招募,无专业年级限制,欢迎感兴趣的同学踊跃报名。

实习有效期最长为10周期限,10周内内未完成实习任务则不能获得实习证明。线上实习时间管理相对自由,可根据自身情况安排时间,可提前结束实习。

活动主办方不对任何因电脑、互联网、移动网络等故障而造成的参与开源实习文件损坏、缺失、提交延时等后果承担责任。

本活动奖金均为税前金额,实际到手奖金以税后为准。

活动主办方保留对活动规则进行调整修改的权利,拥有对本活动的最终解释权。

啥也别说了,赶紧开干!

关注公众号,可别错过奖金~