Location
Beijing
Posted
June 27, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
混元强化训练框架研发工程师(深圳/北京/上海) 北京 分享 1.参与Research场景下Agent框架的研发与维护,支持强化学习、数据生成及自动化评估等业务需求;
2.负责优化框架的易用性与稳定性,解决实际运行中的性能瓶颈,保障实验流程的高效执行;
3.支持各类外部Agent策略及评估逻辑的接入,维护相关接口与组件,确保系统的兼容性与扩展性;
4.结合大模型训练视角,配合算法团队进行新Agent范式的工程化落地与探索。 岗位要求 1.具备扎实的Python编程能力,熟悉异步编程(Asyncio)及并发处理的最佳实践,有良好的代码规范意识;
2.熟悉大模型与Agent相关应用技术,熟练使用AI编程工具并理解其工作原理;
3.熟悉K8S及容器化技术,具备相关环境下的开发或部署经验;
4.了解大模型训练全流程(如预训练、SFT、RLHF)及基本原理;
5.具备良好的问题分析及解决能力、沟通合作能力,有较强的Owner意识。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月02日 岗位职责2.负责优化框架的易用性与稳定性,解决实际运行中的性能瓶颈,保障实验流程的高效执行;
3.支持各类外部Agent策略及评估逻辑的接入,维护相关接口与组件,确保系统的兼容性与扩展性;
4.结合大模型训练视角,配合算法团队进行新Agent范式的工程化落地与探索。
2.熟悉大模型与Agent相关应用技术,熟练使用AI编程工具并理解其工作原理;
3.熟悉K8S及容器化技术,具备相关环境下的开发或部署经验;
4.了解大模型训练全流程(如预训练、SFT、RLHF)及基本原理;
5.具备良好的问题分析及解决能力、沟通合作能力,有较强的Owner意识。