📍 Jobs Near Me
📍

HiringNearMe.work

Local Jobs, Zero Commute

📍 Local Job Near You

混元强化训练框架研发工程师(深圳/北京/上海)

🏢
Tencent
📍 Beijing, China
📍
Location Beijing
📅
Posted June 27, 2026
🚗
Commute Local Area
🎯
Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

混元强化训练框架研发工程师(深圳/北京/上海) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月02日 岗位职责
  • 1.参与Research场景下Agent框架的研发与维护,支持强化学习、数据生成及自动化评估等业务需求;
    2.负责优化框架的易用性与稳定性,解决实际运行中的性能瓶颈,保障实验流程的高效执行;
    3.支持各类外部Agent策略及评估逻辑的接入,维护相关接口与组件,确保系统的兼容性与扩展性;
    4.结合大模型训练视角,配合算法团队进行新Agent范式的工程化落地与探索。
  • 岗位要求
  • 1.具备扎实的Python编程能力,熟悉异步编程(Asyncio)及并发处理的最佳实践,有良好的代码规范意识;
    2.熟悉大模型与Agent相关应用技术,熟练使用AI编程工具并理解其工作原理;
    3.熟悉K8S及容器化技术,具备相关环境下的开发或部署经验;
    4.了解大模型训练全流程(如预训练、SFT、RLHF)及基本原理;
    5.具备良好的问题分析及解决能力、沟通合作能力,有较强的Owner意识。
  • Apply for This Job

    Submit Application

    Quick and secure application process

    📍 Location Details

    🌆
    City
    Beijing
    🗺️
    Country
    China
    🚗
    Commute
    Local Area

    🔍 More Jobs Nearby

    Explore other opportunities in Beijing

    View Local Jobs