SRE(运维工程师)一文详解技术体系和架构师成长之路

SRE(运维工程师)一文详解技术体系和架构师成长之路_第1张图片

 

        今天来讨论一下SRE的一个成长路线,这里结合博主8年的大厂工作经验,分享一下SRE的一个成长路线。

        也希望一个运维工程师能找到一个合适的定位和发展,欢迎关注微信公众号“SRE说”这里有更加详细的说明

入门篇:重要的是如何能够通过面试去进入一个更高的平台

1.1-开篇

1.2 SRE的日常

1.3 SRE之基本能力

2.1 面试总结

2.2 工作总的一些感悟

2.3 操作系统十大面试问题-CPU篇

2.4 操作系统10大面试题-内存篇

2.5 操作系统常见10大面试题网络篇

2.6 操作系统常见10大面试磁盘-IO-文件系统

2.7 基础概念-软中断与硬中断

2.8 十大常用shell命令

2.9 白话网络分层

初级篇:这一篇主要介绍在进入公司之前作为SRE应该如何快速融于公司,了解哪些基础的组件,可能马上要面对的是三个问题,业务的学习、基础能力的学习、小的系统快速搭建。

3.1 监控体系介绍

3.2从SRE角度去加监控

3.3 监控指标的选择和说明

3.4 监控系统实践

3.5 广告交易系统—介绍

3.6 风控系统

8.1 SRE 要懂点前端-vue

8.2 SRE要懂点前端2-vuex的介绍和使用

8.3 SRE也要懂点前端-elementui+echart

8.4 SRE要懂点前端-http与跨域

中级篇:这一部分重点介绍的需要一个或者几个方向深入的去研究。作为SRE三板斧来说稳定性、成本、效率,需要要深入的理解。

4.1 稳定性-概述

4.2 稳定性-单机房故障

4.3 稳定性-分级发布

4.4 稳定性-容量平台

4.5 雪崩问题应该如何解决和避免

4.6 稳定性之反模式

4.7 节假日稳定性保障

4.8 从稳定性角度去看待压测

4.9 从稳定性角度去做预案

4.10 稳定性复盘

5.1 数据安全与数据可靠是什么关系?终极武器是什么?

5.2 数据可靠性-数据备份

5.3 数据可靠性保障核心之数据校验

5.4 数据可靠性-磁盘故障预测

5.5 数据可靠性-人为因素避免

5.6 数据可靠性-数据流动

高级篇:这一部分重点介绍的需要在多个方向有深入的理解,SRE不仅仅是运维的几个方向,而是要对多个方向去广泛涉猎,去了解如何使使用。

6.1 AIOps思考

6.2 AIOps 运维中一些常见异常检查算法

6.3 异常检测-建设思路

6.4 常用异常检测算法的实践

6.5 异常检测-决策树实践

6.6 AIOps实践之异常检查与报警

6.7 关于AIOps最常见的六种场景

7.1 初识大数据技术体系

7.2白话大数据之谷歌三篇论文

7.3 白话大数据之HDFS

7.4 白话大数据之Hbase

7.5 白话大数据之数据仓库

7.6 白话大数据之OLAP

7.7 白话大数据之Mapreduce、Storm、Spark、Flink选择

8.1 容器的三大核心技术

8.2 浅谈容器

8.3 k8s存储服务管理

8.4 容器调度

8.5 服务网格

8.6 从小区管理看k8s的系统架构

8.7 浅谈Kubernetes的pod

9.1 白话系列之EM算法

9.2 白话 lstm与rnn

9.3 马尔可夫

9.4 白话系列之常见概率分布

9.5 白话系列之前馈神经网络、反向误差传播、受限玻尔兹曼

9.6 白话系列之 蒙特卡洛方法

10.1  ABC之白话总结

资深篇

    这一部分重点介绍如何去独立承担一些大的项目。比如组织一次大的活动保障,比如去做一个大的架构优化,需要多个部门,多个团队去合作。

活动稳定性保障之春节红包

春晚活动保障之流量预估

节假日稳定性保障

全球部署系列文章

全球部署之业务、网络、IDC之间的关系

全球部署之异地多活

全球部署之快速部署

全球部署之用户调度

你可能感兴趣的:(运维,运维感悟,运维)