超大模型训练研究员(全职/实习) 面议
上海人工智能实验室通用视觉智能岗位招聘需求专业(供参考):
计算机科学与技术, 电子信息
截止日期:详见正文 2022-10-10发布
职位详情
基本信息
- 报名方式:站内投递
- 需求专业(供参考): 计算机科学与技术, 电子信息
岗位职责
1、致力于超大规模模型的研究与发展。
2、具体职责包括但不限于:
1)参与大模型训练系统的开发和优化,提升大模型训练性能,提高训练集群利用效率;
2)优化大模型训练下集群的分布式性能和通信速度;
3)探索前沿大模型训练相关技术的发展和迭代,包括但不限于计算划分与调度、动态重计算、流水线优化等。
2、具体职责包括但不限于:
1)参与大模型训练系统的开发和优化,提升大模型训练性能,提高训练集群利用效率;
2)优化大模型训练下集群的分布式性能和通信速度;
3)探索前沿大模型训练相关技术的发展和迭代,包括但不限于计算划分与调度、动态重计算、流水线优化等。
任职要求
1、了解大规模模型的发展与应用,具备快速学习能力和较强的理解力。
2、了解模型显存压缩和训练加速等常见优化方法,熟悉常见算子的计算和实现原理,熟悉混合精度模型训练技术。
3、了解大规模模型设计思路与方法,熟悉底层原理与实现。
4、熟悉C++ 或 Python,PyTorch或其他深度学习平台,熟悉训练相关的分布式方法。
5、有团队协作精神,有责任心,乐于接受挑战。
6、满足以下一个或多个条件的,优先考虑:
1)对主流平台(x86, ARM, GPU, FPGA等)的架构有一定了解;
2)了解GPU体系结构,有NVIDIA CUDA开发经验;
3)了解大规模并行训练或有相关经验;
4)有性能优化或算子开发等相关经验;
5)有节点通信、同步调优等相关经验;
6)有较强的竞赛成绩,获得过ACM,NOI,NOIP或其他商业代码竞赛的任意奖项。
7、实习岗位要求能连续实习6个月以上,每周到岗不低于4个工作日。
上海人工智能实验室通用视觉智能岗位招聘
2、了解模型显存压缩和训练加速等常见优化方法,熟悉常见算子的计算和实现原理,熟悉混合精度模型训练技术。
3、了解大规模模型设计思路与方法,熟悉底层原理与实现。
4、熟悉C++ 或 Python,PyTorch或其他深度学习平台,熟悉训练相关的分布式方法。
5、有团队协作精神,有责任心,乐于接受挑战。
6、满足以下一个或多个条件的,优先考虑:
1)对主流平台(x86, ARM, GPU, FPGA等)的架构有一定了解;
2)了解GPU体系结构,有NVIDIA CUDA开发经验;
3)了解大规模并行训练或有相关经验;
4)有性能优化或算子开发等相关经验;
5)有节点通信、同步调优等相关经验;
6)有较强的竞赛成绩,获得过ACM,NOI,NOIP或其他商业代码竞赛的任意奖项。
7、实习岗位要求能连续实习6个月以上,每周到岗不低于4个工作日。
上海
竞争力分析
解锁详细分析
您与该职位匹配度: ***,已超过了 *** 的竞争者,建议************
您在 ?位置
较低
一般
比较匹配
非常匹配
上海人工智能创新中心
自然与应用科研机构(事业单位类型)· 公立(国有)· 0-199人
求职安全提示
求职过程中如遇到招聘单位有收费、指定医院体检等行为,请提高警惕,有可能属于诈骗或违规行为。
请查看
重要风险提示
求职安全提示
*重要风险提示
如招聘单位在招聘过程中向求职者提出收取押金、保证金、体检费、材料费、成本费,或指定医院体检等,求职者有权要求招聘单位出具物价部门批准的收费许可证明材料,若无法提供相关证明,请求职者提高警惕,有可能属于诈骗或违规行为。
职位编制说明
职位编制内容仅供参考!请以用人单位发布的公告&职位信息内容为准,或联系用人单位确认。
求职安全提示
*责任声明
声明:本站部分公告与职位内容由本站根据官方招聘公告进行整理编辑。由于用人单位需求专业、学历学位、资格条件、职位编制、备注内容等内容情况复杂且有变化可能,是否符合招聘条件以用人单位公告为准或请联系用人单位确认。本站整理编辑的职位信息仅供求职者参考,如因此造成的损失本站不承担任何责任!
收藏
竞争力分析