Location
Shenzhen
Posted
June 26, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
混元多模态大模型算法加速工程师(深圳/北京/上海/杭州) 深圳 分享 1.主动跟踪学术界与工业界在图像视频生成式模型、多模态理解模型、语音模型、多模态理解生成统一建模等方向的创新算法研究,攻克Diffusion模型加速、多模态理解模型、语音模型(ASR、TTS、Omini等)、多模态理解生成统一建模加速等技术方向,包括但不限于:(Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等);
2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态大模型的推理效率,显著降低端到端延迟;
3.作为算法与框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档与实验报告,并组织内部分享,推动团队整体技术认知提升。 岗位要求 1.拥有计算机科学、人工智能、电子工程、自动化等相关专业。具备扎实的机器学习/深度学习基础;
2.精通Python编程,熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构、计算瓶颈与优化方法论有深刻理解; 具33、图像视频生成、音频理解生成、图像视频编辑/理解、模型压缩(步数蒸馏,轻量化模型,投机解码、KVCache优化、稀疏剪枝等)、生成对齐算法(DPORLHF等)。 加分项 1.在Kaggle等比赛获奖者优先、在ICML/NeurIPS/CVPR/ECCV/ICCV等发表论文优先、有开源框架核心算法贡献者优先(如HuggingFaceDiffusers优化);
2.熟悉HuggingFace Transformers、vLLM、SGLang等大模型推理框架者优先;
3.熟悉高性能计算、熟悉CUDA/AI芯片编程、并行策略(如模型并行、流水线并行等)...
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月08日 岗位职责2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态大模型的推理效率,显著降低端到端延迟;
3.作为算法与框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档与实验报告,并组织内部分享,推动团队整体技术认知提升。
2.精通Python编程,熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构、计算瓶颈与优化方法论有深刻理解; 具33、图像视频生成、音频理解生成、图像视频编辑/理解、模型压缩(步数蒸馏,轻量化模型,投机解码、KVCache优化、稀疏剪枝等)、生成对齐算法(DPORLHF等)。
2.熟悉HuggingFace Transformers、vLLM、SGLang等大模型推理框架者优先;
3.熟悉高性能计算、熟悉CUDA/AI芯片编程、并行策略(如模型并行、流水线并行等)...