Location
Beijing
Posted
June 15, 2026
Commute
Local Area
Local Opportunity Near You!
This job is in your area. Enjoy a short commute and work close to home.
Job Description
职位描述
1.负责滴滴 Zookeeper / ETCD 集群的稳定性建设与运维管理,保障核心分布式组件高可用运行。
2.负责大规模集群的自动化运维体系建设,包括集群自动化部署、版本升级、故障恢复及容量管理等。
3.建设分布式系统可观测体系,包括 QPS、延迟、watch 数量、连接数、leader 选举等关键指标监控。
4.参与分布式一致性组件的性能优化与架构升级,提升系统吞吐能力与稳定性。
5.负责故障分析与应急响应,快速定位并解决集群异常。
6.参与运维管控平台化/用户侧平台化建设,提高集群治理能力和产研效率
任职要求
1.本科及以上学历,计算机相关专业,5 年以上互联网基础设施或分布式系统运维研发经验。
2.深入理解 分布式一致性协议,如Paxos、Raft
3.熟悉以下分布式组件之一并有生产经验:Apache ZooKeeper、etcd
4.熟悉 Linux 系统原理及网络协议栈,包括 TCP/IP、RPC、服务发现机制等。
5.具备扎实的 编程能力(Go / Python / Java / Shell 等至少一种),golang优先,能够独立开发自动化运维工具或平台。
6.熟悉分布式系统运维经验,能够分析复杂故障并提出系统性优化方案。
7.具备良好的问题分析能力和应急响应能力。