Location
Shenzhen
Posted
June 28, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
混元大模型音频理解算法工程师(北京) 深圳 分享 1.负责语音/音频大模型研发,包括音频理解(ASR/音频caption)、音视频理解等模型研发;
2.负责预训练、后训练、强化学习(文本和音频强化)相关的数据、算法、评测工作;
3.负责音频理解/ASR模型开源以及产品落地(比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化)。 岗位要求 1.有语音识别、音频理解、音乐理解等相关经验者优先;
2.有音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
3.优秀的代码能力、数据结构和算法功底,熟练掌握Python,熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先;
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
5.在相关顶级会议或期刊(如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等)有论文发表者优先;
6.良好的英语文献阅读能力,强烈的进取心/求知欲/团队合作精神,以及优秀的问题解决能力,热衷于追求技术创新。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月26日 岗位职责2.负责预训练、后训练、强化学习(文本和音频强化)相关的数据、算法、评测工作;
3.负责音频理解/ASR模型开源以及产品落地(比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化)。
2.有音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
3.优秀的代码能力、数据结构和算法功底,熟练掌握Python,熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先;
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
5.在相关顶级会议或期刊(如NeurIPS/ICLR/ICML/ACL/CVPR/ICASSP/INTERSPEECH等)有论文发表者优先;
6.良好的英语文献阅读能力,强烈的进取心/求知欲/团队合作精神,以及优秀的问题解决能力,热衷于追求技术创新。