Location
Shenzhen
Posted
June 28, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
混元大语言数据工程师(北京/深圳) 深圳 分享 1.负责文档数据处理的全链路工程实现,包括负责支持文档数据存储计算处理、解析、去重、质量筛选等数据处理环节;
2.有丰富的文档解析或大模型预训练数据处理经验、基于Agent的数据生产链路研发经验优先;
3.有多模态理解数据处理经验优先。 岗位要求 1.硕士及以上学历,计算机视觉、自然语言处理或多模态方向背景优先;
2.熟练掌握深度学习框架(如PyTorch、TensorFlow),熟悉模型训练及数据处理经验,具备优秀的独立开发与分析调研能力;
3.能handle十亿量级的数据处理,对常用的数据工程技术如spark、hadoop、ray,文件存储系统有实践经验;
4.具备良好的团队协作能力,具备强烈的自我驱动力,能够独立完成系统分析与优化,落地大模型应用;
5.有丰富的数据工程架构设计经验优先;有丰富的文档解析或大模型预训练数据处理经验优先;
6.动手能力强,能熟练使用Agent及AI coding工具高效完成工作;有基于Agent的数据生产链路研发经验优先。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 一年以上工作经验 更新于年06月26日 岗位职责2.有丰富的文档解析或大模型预训练数据处理经验、基于Agent的数据生产链路研发经验优先;
3.有多模态理解数据处理经验优先。
2.熟练掌握深度学习框架(如PyTorch、TensorFlow),熟悉模型训练及数据处理经验,具备优秀的独立开发与分析调研能力;
3.能handle十亿量级的数据处理,对常用的数据工程技术如spark、hadoop、ray,文件存储系统有实践经验;
4.具备良好的团队协作能力,具备强烈的自我驱动力,能够独立完成系统分析与优化,落地大模型应用;
5.有丰富的数据工程架构设计经验优先;有丰富的文档解析或大模型预训练数据处理经验优先;
6.动手能力强,能熟练使用Agent及AI coding工具高效完成工作;有基于Agent的数据生产链路研发经验优先。