about the company.
全球交易量前列的加密货币交易所之一,持有全球多个市场合规牌照,平台稳定性高
about the team.
强有力的团队背景,产品技术积淀深厚
responsibilities:
- 数据平台与基础设施优化: 负责大型分布式数据平台(包括大数据计算与存储、数据仓库)的架构稳定性保障和性能深度优化。
- 高可用中间件保障: 深入理解核心业务中间件(如消息队列、服务治理、API网关等)的架构原理,确保系统的高性能、高可用运行。
- 运行时环境精调: 持续优化虚拟化、容器化和云原生(如K8S、Docker、JVM等)等运行时环境,提升资源利用效率和服务运行稳定性。
- 网络与安全加固: 理解并指导网络架构和安全防护层的稳定性建设,确保安全、高效的网络通信。
- 混沌工程与应急响应: 领导或参与混沌工程演练,通过故障模拟提升系统鲁棒性;负责系统故障快速排查和应急处理,并持续优化监控策略。
- 效率驱动与技术支持: 推进基础设施自动化和智能化,提高SRE工作效率;与开发团队紧密协作,提供专业基础设施技术支持。
skills and experience required.
- 专业背景与经验: 计算机或相关专业本科及以上学历,8年以上大型互联网或云平台开发/SRE/运维经验。
- 技术深度: 对大数据、数据仓库、核心中间件、运行时环境及网络技术架构和原理有深入理解,具备丰富的实战经验和故障排查能力。
- 操作系统与自动化: 精通Linux系统管理与优化,熟练使用Shell/Python等脚本语言进行自动化工具和脚本开发。
- 云原生技术: 熟悉KVM、Docker、K8S等容器化和云原生技术的架构和原理,有丰富的故障处理经验。
- 网络排障能力: 熟悉TCP/UDP等网络协议,精通使用网络命令和工具进行常见网络问题排查(如TcpDump, Wireshark等)。
- 云平台实战: 具备主流大型云服务平台(如国内头部云或国际主流云)从架构设计到实际应用的丰富经验,能处理复杂云环境下的故障。
- 稳定性实践经验(加分项): 有服务治理体系、架构优化、容量管理、混沌工程等稳定性保障体系建设经验者优先。
- 综合素质与语言: 强烈的责任心、团队合作精神和优秀的分析解决问题能力;必须具备中文沟通能力,中英文双语流利者优先。
Perks & Benefits
- 有竞争力的总薪酬方案
- 为员工的成长和发展提供培训和教育补贴
- 各种团队建设项目和公司活动
- 健康及膳食津贴
- 雇员和家属提供全面的医疗保健计划