岗位职责:
- 负责制造系统和网络基础设施的设计、部署和支持。
- 为中国境内的基础设施建设提供支持,包括数据中心、Linux 系统(包括虚拟化服务器和裸机服务器)。
- 安装、配置和维护 Linux 服务器环境。
- 确保现有系统的可靠性,以保证核心基础设施服务的正常运行时间和可用性。
- 对涉及硬件、操作系统、应用程序、网络和信息安全平台等复杂问题进行根本原因分析。
- 与不同业务部门合作,根据业务需求识别、规划、测试、部署或升级 Linux 系统。
- 与公司各部门团队合作,在协作高效的环境中共同解决难题。
- 处理涵盖硬件、软件、网络和应用等全栈的问题。
- 管理 GitHub、Artifactory 等工程工具和平台。
- 对核心基础设施组件进行分析、故障排除和自省,并处理事件响应。
- 创建并维护完善的知识库,并指导初级工程师。
- 承担值班职责,快速响应紧急情况,并提供快速有效的解决方案,最大限度地减少系统停机时间。
任职要求:
- 3 年以上大型 Linux 环境管理经验。
- 丰富的从内核到应用层的分析和调优经验,能够在给定的硬件配置下提升性能。
- 具备监控系统经验,最好熟悉 Prometheus 和 Grafana。
- 精通 SHELL、Python 或其他编程语言的脚本编写。
- 具备配置管理系统(例如 Puppet、Ansible)的使用经验。
- 深入了解基础架构服务(TCP/IP、DNS、NTP、DHCP、SAML、PKI)。
- 具备运行和管理基于 Kubernetes 的服务和应用程序的经验。
- 拥有出色的分析、沟通(书面和口头)和问题解决能力。
- 能够与全球团队协作,高效地维护文档并提供培训。
- 能够持续适应并优先处理不断变化的环境和业务需求。
优先考虑的资格:
- 工程、数学、计算机科学或信息技术学士学位。
- 拥有 RHCE、RHCA、ITIL 相关认证者优先。
- 英语口语和写作流利。