📍 Jobs Near Me
📍

HiringNearMe.work

Local Jobs, Zero Commute

📍 Local Job Near You

Site Reliability Engineer

🏢
POIZON Global
📍 singapore, Singapore
📍
Location singapore
📅
Posted June 03, 2026
🚗
Commute Local Area
🎯
Local Opportunity Near You!

This job is in your area. Enjoy a short commute and work close to home.

📋
Job Description

职责

  • 1. 负责公司业务系统稳定性保障,提升业务稳定性和工程效率,与业务方保持高效沟通,建立良好合作关系;
  • 2. 负责应用上线、配置变更、状态监控、容量管理、故障应急响应等工作;
  • 3. 基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等
  • 4. 负责线上重大问题排查,紧急事故处理,后续事故分析与优化;
  • 5. 负责应用故障演练、应急预案、SOP手册编写工作
  • 6. 负责应用高可用建议及管理,包括限流、降级,容错、容灾,同城多活等
  • 7. 建立SLO评估标准,统计故障对SLO影响,并对SLO保障相关的后续改进措施进行跟进
  • 8. 负责运维规范、流程文档编制,并将其工具化、平台化,确保运维安全,提升运维效率
  • 9. 负责解答其他同事在日常工作中IT相关的问题
  • 10. 负责排查定位解决新加坡职场、云厂商有关网络问题。

任职要求

  • 1. 5年以上互联网公司运维相关经验
  • 2. 熟悉JVM虚拟机的内存机制、GC机制,能进行JAVA进程异常的故障定位及排查
  • 3. 熟悉Nginx,Zookeeper, Kafka, RocketMQ等常用WEB中间件的维护与使用;
  • 4. 熟悉常见监控系统,如Zabbix,Grafana,Prometheus等
  • 5. 熟悉Memcache、Redis、Twemproxy等开源缓存解决方案
  • 6. 有丰富的系统故障排查和解决经验,突出的分析和解决问题的能力
  • 7. 良好的Troubleshouting思路与经验,能够快速解决线上事故
  • 8. 至少能掌握Python/Shell/GO/Java等一至两种语言,有项目开发经验者优先
  • 9. 有业务容量管理、链路稳定性治理、从系统设计到上线的整个生命周期内稳定性保障工作经验者优先
  • 10. 熟悉S...

Apply for This Job

Submit Application

Quick and secure application process

📍 Location Details

🌆
City
singapore
🗺️
Country
Singapore
🚗
Commute
Local Area

🔍 More Jobs Nearby

Explore other opportunities in singapore

View Local Jobs