Location
Shenzhen
Posted
June 21, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
魔方工作室-视频生成基础模型训练工程师 深圳 分享 渴望为世界带来新意的人,早已对描绘未来的“热词”不陌生——人工智能、机器学习、数据科学等等。腾讯始终在业界前沿不断探索,积极布局,并为优秀的你提供无限广阔的舞台。我们坚信科技的不断革新,最终能带来美好的、撼动人心的改变。 岗位职责 1.基模预训练:主导/参与视频扩散或自回归视频基模(DiT / 时空 Transformer)的大规模预训练,包括架构设计、训练目标、scaling 策略与稳定性调优;
2.可控/条件生成:实现首末帧、轨迹、深度、mask、参考图等多种控制信号的条件注入,保障身份一致性与场景反应合理性;
3.实时化改造:将双向/全序列模型改造为因果自回归、流式逐 chunk 生成;落地 Self-Forcing / Causal Forcing / DMD 等少步数蒸馏,实现实时帧率;
4.推理优化协同:与推理工程团队配合做 FP4/INT8 量化、TensorRT、流式批处理(stream-batch),在延迟 SLA 内最大化单卡吞吐;
5.评测体系:建立画质、时序一致性、身份保持、控制响应、延迟等量化评测,驱动迭代;
6.训练基础设施:在多机多卡(数百~上千 GPU)上做分布式训练(FSDP / DeepSpeed / Megatron;
7.风格并行),处理 OOM、通信瓶颈、混合精度稳定性等问题。 岗位要求 1.计算机 / AI / 数学相关硕博,或同等工程能力;5年以上深度学习研发经验;
2.精通 PyTorch,熟悉大规模分布式训练(FSDP / DeepSpeed / Megatron-LM 至少其一),有实际跑通过百卡级训练的经验;
3.深入理解扩散模型(DDPM/DDIM/Flow Matching/Rectified Flow)与/或自回归生成,理解 DiT / U-ViT 等架构;
4.熟悉视...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 IEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年06月24日2.可控/条件生成:实现首末帧、轨迹、深度、mask、参考图等多种控制信号的条件注入,保障身份一致性与场景反应合理性;
3.实时化改造:将双向/全序列模型改造为因果自回归、流式逐 chunk 生成;落地 Self-Forcing / Causal Forcing / DMD 等少步数蒸馏,实现实时帧率;
4.推理优化协同:与推理工程团队配合做 FP4/INT8 量化、TensorRT、流式批处理(stream-batch),在延迟 SLA 内最大化单卡吞吐;
5.评测体系:建立画质、时序一致性、身份保持、控制响应、延迟等量化评测,驱动迭代;
6.训练基础设施:在多机多卡(数百~上千 GPU)上做分布式训练(FSDP / DeepSpeed / Megatron;
7.风格并行),处理 OOM、通信瓶颈、混合精度稳定性等问题。
2.精通 PyTorch,熟悉大规模分布式训练(FSDP / DeepSpeed / Megatron-LM 至少其一),有实际跑通过百卡级训练的经验;
3.深入理解扩散模型(DDPM/DDIM/Flow Matching/Rectified Flow)与/或自回归生成,理解 DiT / U-ViT 等架构;
4.熟悉视...