📍 Jobs Near Me
📍

HiringNearMe.work

Local Jobs, Zero Commute

📍 Local Job Near You

混元Agent评测Infra工程专家(北京/上海/深圳)

🏢
Tencent
📍 Beijing, China
📍
Location Beijing
📅
Posted June 21, 2026
🚗
Commute Local Area
🎯
Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

混元Agent评测Infra工程专家(北京/上海/深圳) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月05日 岗位职责
  • 1.主导 Agent Benchmark 的平台化落地:负责 SWE、Terminal、Claw、MCP 等多类 Agent Benchmark 在评测平台上的整体接入与工程化,沉淀标准化、可复用的接入能力;
    2.构建评测运行底座:统筹沙盒环境、依赖管理、网络访问、并发调度等关键能力建设,保障大规模评测在生产环境下的稳定、可复现与高效运行;
    3.保障评测质量与可观测性:从 Harness 与打分逻辑出发,确保平台化改造后评测结果的准确可信,并建立完善的诊断与问题归因能力;
    4.衔接算法与工程:深入理解各 Benchmark 所考察的模型能力维度,作为算法与平台之间的技术桥梁,推动评测需求高质量落地。
  • 岗位要求
  • 1.计算机相关专业本科及以上学历,3年及以上后端 / 平台 / Infra 研发经验;
    2.精通至少一门主流后端语言(Python / Go / Java 等),主导过中大型平台或系统的设计与落地,具备优秀的系统设计与工程实现能力;
    3.熟悉容器化与沙盒隔离、分布式系统、任务调度与并发控制,有大规模任务编排或性能优化经验;熟悉网络通信与代理机制,能处理外部接口访问与稳定性问题;
    4.了解大模型与 Agent 的基本原理,熟悉主流 Agent Benchmark(如 SWE-bench、Terminal-Bench、MCP 相关评测等)的 Harness 与打分逻辑,并据此进行工程化抽象,能与算法团队就模型能力与评测指标深度对话;
    5.具备丰富的跨团队协作经验,能在算法、平台、底层基础设施等多方之间有效拉通与推进;具备较强的技术主导力与 Owner 意识,面对复杂不确定问题有冲劲、能扛事、能落地。
  • Apply for This Job

    Submit Application

    Quick and secure application process

    📍 Location Details

    🌆
    City
    Beijing
    🗺️
    Country
    China
    🚗
    Commute
    Local Area

    🔍 More Jobs Nearby

    Explore other opportunities in Beijing

    View Local Jobs