about the company.
知名500强公司
about the team.
成熟的国际化团队
responsibilities:
1.提升系统稳定性与可用性。
2.你将主导项目,通过自动化、增强系统可观测性,并前瞻性地解决潜在问题,以最大限度地减少运营中断。
3.确保能持续稳定地提供服务。
4.自动化开发的工作
skills and experience required.
1.具备SRE(站点可靠性工程)或相关经验。
2.深入理解系统架构、设计原则和云平台。
3.熟练运用脚本语言(如Python)进行自动化开发。
4.熟悉监控与警报工具(如Prometheus, Grafana)和事件管理流程。
...