积极参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性;
诊断解决关键服务的紧急故障,能采取各种技术手段改进,防止故障再现;
负责服务的容量规划,以及软件的性能分析和优化;
负责或参与面向大规模分布式系统的软件架构设计;
探索运维自动化和智能化的技术和方向;
负责相关工作文档撰写及上级安排的其他相关工作。
三年以上运维工作经验;
对linux系统原理,网络,存储等基础知识有深刻的理解;
两年以上公有云平台运维经验(具备阿里云 ACP 认证者优先);
熟悉K8S各组件的原理和使用方法,能够熟练编写 yaml 配置文件;
精通 Tomcat、Nginx、MySQL、Redis、MQ等常见应用的安装配置及优化。
熟练掌握Python、Go 等计算机编程语言;
具有良好独立分析、解决问题的能力,可以快速应对线上各种紧急情况。
有一定网络基础,对TCP/IP、HTTP/HTTPS、DNS等原理有深刻的理解。
学习能力强,良好的沟通能力和团队合作能力。
北京得实大厦