📍 Local Job Near You

混元强化训练框架研发工程师（深圳/北京/上海）

🏢

Tencent

📍 Beijing, China

📍

Location Beijing

📅

Posted June 27, 2026

🚗

Commute Local Area

🎯

Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

                    混元强化训练框架研发工程师（深圳/北京/上海） 北京 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月02日 岗位职责 1.参与Research场景下Agent框架的研发与维护，支持强化学习、数据生成及自动化评估等业务需求；
2.负责优化框架的易用性与稳定性，解决实际运行中的性能瓶颈，保障实验流程的高效执行；
3.支持各类外部Agent策略及评估逻辑的接入，维护相关接口与组件，确保系统的兼容性与扩展性；
4.结合大模型训练视角，配合算法团队进行新Agent范式的工程化落地与探索。
 岗位要求 1.具备扎实的Python编程能力，熟悉异步编程（Asyncio）及并发处理的最佳实践，有良好的代码规范意识；
2.熟悉大模型与Agent相关应用技术，熟练使用AI编程工具并理解其工作原理；
3.熟悉K8S及容器化技术，具备相关环境下的开发或部署经验；
4.了解大模型训练全流程（如预训练、SFT、RLHF）及基本原理；
5.具备良好的问题分析及解决能力、沟通合作能力，有较强的Owner意识。

Apply for This Job

Submit Application

Quick and secure application process

📍 Location Details

🌆

City

Beijing

🗺️

Country

China

🚗

Commute

Local Area

🔍 More Jobs Nearby

Explore other opportunities in Beijing

View Local Jobs

混元强化训练框架研发工程师（深圳/北京/上海）

📋 Job Description

Apply for This Job

📍 Location Details

🔍 More Jobs Nearby

📋
Job Description