SRE (Site Reliability Engineering )

数人云于2016年11月推出SRE培训

线下培训 线上培训
Introduction  

关于数人云SRE 培训

SRE (Site Reliability Engineering )是由Google最早提出的一个运维领域的崭新概念。它不仅代表了一种全新的运维理念和其伴随的崭新的工程领域,也代表了一套完整的系统运维体系和与其对应的最佳实践。

数人云于2016年11月推出SRE培训(线上/线下),旨在通过对Google SRE实践的分析来阐释SRE 如何在项目的各个生命周期为其提供持续性支持。帮助国内企业运用SRE的理念来搭建适合企业的系统运维体系并有效地维护软件架构的性能和稳定。

培训讲师

lecturer

...

孙宇聪   数人云技术顾问

前Google  SRE, 《SRE:Google运维解密》译者 。曾参与设计维护 Youtube 视频转码/存储/直播管理系统, 参与研发管理全球 Youtube CDN 网络, 后就职于 Google 内部云计算部门开发维护全球百万台服务器生命周期管理系统及任务管理系统。

...

王璞   数人云CEO

美国 George Mason 大学计算机博士。擅长分布式计算、大规模机器学习、海量数据处理。曾担任 Google 广告部门数据平台构架师,负责管理每秒访问量全球最高的架构平台。

...

肖德时   数人云CTO

曾任红帽 Engineering Service 部门内部工具组 Team Leader,是国内第一代 Docker 代码贡献者。现负责数人云产品研发及架构设计工作,对 Docker 容器等云计算相关技术有深入研究。

...

谢乐冰   数人云COO

在德国工作十年,回国后加入惠普电信运营商部门,拥有多年项目经验和创业公司工作经验。在数人云负责产品售前和运营,专注企业级技术应用领域,为金融、电信、电商等行业提供服务。

...

庞铮   数人云运维总监

15 年以上运维工作经验。就职过宏碁戏谷、第三波、SQUARE ENIX CO., LTD. 等。2015年加入数人云,从事数人云平台运维管理,在 Mesos+Docker 应用实践方面有深入研究。

培训详情

particular

基础篇

SRE概览和Google SRE系统介绍

原理篇

SRE核心理念和基本原理

实践篇

SRE在值班、响应、追踪、负载均衡、分布式批处理等方面的具体实践

管理篇

SRE团队构建、团队管理以及和其他团队的沟通协作