📍 Local Job Near You

保险科技-大模型高级工程师

🏢

Tencent

📍 Shenzhen, China

📍

Location Shenzhen

📅

Posted June 21, 2026

🚗

Commute Local Area

🎯

Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

                    保险科技-大模型高级工程师 深圳 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 CDG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月09日 渴望为世界带来新意的人，早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索，积极布局，并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新，最终能带来美好的、撼动人心的改变。
 岗位职责 1.：负责保险大模型的Post-training全流程：包括SFT 监督微调、RLHF/DPO/GRPO 模型对齐、奖励模型（Reward Model）研发，提升模型在保险场景的专业问答、复杂推理、合规风控能力；
2.：设计并建设保险领域高质量指令数据集（核保、理赔、健康咨询、保单解读、合规问答等），主导数据标注、清洗、过滤、蒸馏与质量评估，支撑模型迭代与能力升级；
3.：基于Agentic-RL构建保险业务仿真环境与 API 对接体系，支持保单查询、理赔试算、核保校验、健康咨询等工具调用，提升模型在真实保险流程中的决策与执行能力；
4.：搭建保险垂类自动化评测体系（事实准确率、合规率、推理深度、用户满意度），持续跟踪模型效果，驱动数据与算法迭代，保障模型在保险全链路（售前 / 售中 / 售后）的稳定落地。
 岗位要求 1.：硕士及以上学历，计算机、人工智能、机器学习、NLP、统计学等相关专业，2 年以上大模型后训练 / 算法研发经验，有保险 / 金融垂类模型训练或落地经验优先；
2.：精通LLM 后训练全流程：SFT、RLHF（PPO/DPO/GRPO）、Reward Model、模型对齐；熟练使用PyTorch、Transformers、DeepSpeed、Megatron-LM、vLLM等训练 / 推理框架；熟悉指令微调数据构建、偏好数据（Preference Data）建设、数据质量评估全链路；有保险 / 金融领域知识图谱、RAG、智能体（Agent）开发经验加分。

Apply for This Job

Submit Application

Quick and secure application process

📍 Location Details

🌆

City

Shenzhen

🗺️

Country

China

🚗

Commute

Local Area

🔍 More Jobs Nearby

Explore other opportunities in Shenzhen

View Local Jobs

保险科技-大模型高级工程师

📋 Job Description

Apply for This Job

📍 Location Details

🔍 More Jobs Nearby

📋
Job Description