×
<在线客服<
描述
021-53098865


欢迎来到雅菲奥朗官网
欢迎来到雅菲奥朗官网

系统可靠性工程师 (高级)

工信部教考中心精心设计的《系统可靠性工程师》高级课程,聚焦站点可靠性工程(SRE)体系,深度融合可靠性与服务韧性理念,系统阐释现代数字基础设施可靠性建设的理论与最佳实践。本课程旨在帮助学员全面掌握SRE核心方法论,深入理解服务级别目标、可观测性、混沌工程等关键技术域。

系统可靠性工程师 (高级)
  • 系统可靠性工程师 (高级)
0
相关课程
  • 课程详情
  • 【课程概览】

    工信部教考中心精心设计的《系统可靠性工程师》高级课程,聚焦站点可靠性工程(SRE)体系,深度融合可靠性与服务韧性理念,系统阐释现代数字基础设施可靠性建设的理论与最佳实践。本课程旨在帮助学员全面掌握SRE核心方法论,深入理解服务级别目标、可观测性、混沌工程等关键技术域,快速获得金融、运营商、云厂商等行业头部企业的实战要点与落地建议。通过本课程学习,学员能够建立量化驱动的可靠性思维,打造具备故障韧性、自愈能力与持续改进特性的技术平台,不断提升所维护系统的稳定性与业务连续性;以SRE作为"主动管理复杂系统风险"之道,构建从故障预防、快速响应到智能运维的完整能力闭环,切实降低事故损失,实现降本增效目标。

     

    【课程级别】高级


    【课程天数】2天


    【认证单位】工业和信息化部教育与考试中心


    【课程对象】

    ● 系统可靠性工程师(SRE)

    DevOps/自动化运维工程师

    ● 云平台(IaaS/PaaS/SaaS)运维负责人

    ● IT总监、IT经理、技术团队负责人

    ● 软件工程师、系统架构师、产品经理、Scrum Master

    ● 业务连续性/变革推动者、咨询顾问及工具厂商技术顾问

     

    【课程收益】

    完成本课程后,学员将能够:

    ● 在组织内建立量化驱动的SRE文化,运用六大原则指导系统可靠性工作,参考金融及云厂商最佳实践构建适合自身业务特点的SRE体系;

    ●  独立制定科学合理的SLI/SLO指标体系与错误预算政策,实现业务需求与技术实现的精准对齐,将SLO达成率提升至行业领先水平;

    ●  设计并实施统一监控与可观测性平台,整合Metric、Trace、Log等多维数据,运用Jaeger等工具实现故障分钟级定位与根因分析;

    ●  主导混沌工程常态化建设,策划并执行千级别演练场景,精准捕获高可用隐患,系统性提升系统反脆弱性与应急响应能力;

    ●  构建基于MTTx指标的故障管理体系,搭建ChatOps协同应急平台,实现P1事件自动回滚与专家蜂群式快速集结,大幅降低故障损失;

    ●  将AI/ML技术融入运维流程,通过日志分析、异常检测与智能算法实现预测性运维,结合大模型能力推动运维智能化转型;

    ●  推动SRE标准体系在组织落地,运用四步法完成现状评估、差距分析与认证准备,建立可持续改进的可靠性成熟度模型;

    ●  规划并建设全链路可观测性能力,分阶段实现数据互通、立体观测与智能洞察,为复杂分布式系统提供全景可观测视图。

    ●  获得职业资格认证,完成课程并通过考试的学员,将获得工信部教考中心颁发的《系统可靠性工程师(高级)》职业技术证书。

     

    【发证机构】

    工业和信息化部教育与考试中心(简称:工信部教考中心)是中国工业和信息化部下属的一个专门机构,主要负责组织实施工业和信息化领域的教育培训及资格考试工作。近年来,工信部教考中心在国家认证课程创新方面很多建树,例如之前主导的国家软考认证(即《计算机技术与软件专业技术资格(水平)考试认证》)得到了全国各行业的持续推广和广泛好评,成为软件教育方面的冠军认证。


    【课程内容】

    一、破冰之旅:自我介绍 & SRE基本概念

    二、 SRE原则与实践

    三、服务级别目标

    四、 监控与可观测性

    五、混沌工程

    六、构建安全和可靠的系统

    七、SRE和故障管理

    八、人工智能运维与DataOps

    九、SRE标准介绍

    十、SRE开源工具介绍与分析

    十一、全链路可观测性建设与案例分享


    【课程概览】

    工信部教考中心精心设计的《系统可靠性工程师》高级课程,聚焦站点可靠性工程(SRE)体系,深度融合可靠性与服务韧性理念,系统阐释现代数字基础设施可靠性建设的理论与最佳实践。本课程旨在帮助学员全面掌握SRE核心方法论,深入理解服务级别目标、可观测性、混沌工程等关键技术域,快速获得金融、运营商、云厂商等行业头部企业的实战要点与落地建议。通过本课程学习,学员能够建立量化驱动的可靠性思维,打造具备故障韧性、自愈能力与持续改进特性的技术平台,不断提升所维护系统的稳定性与业务连续性;以SRE作为"主动管理复杂系统风险"之道,构建从故障预防、快速响应到智能运维的完整能力闭环,切实降低事故损失,实现降本增效目标。

     

    【课程级别】高级


    【课程天数】2天


    【认证单位】工业和信息化部教育与考试中心


    【课程对象】

    ● 系统可靠性工程师(SRE)

    DevOps/自动化运维工程师

    ● 云平台(IaaS/PaaS/SaaS)运维负责人

    ● IT总监、IT经理、技术团队负责人

    ● 软件工程师、系统架构师、产品经理、Scrum Master

    ● 业务连续性/变革推动者、咨询顾问及工具厂商技术顾问

     

    【课程收益】

    完成本课程后,学员将能够:

    ● 在组织内建立量化驱动的SRE文化,运用六大原则指导系统可靠性工作,参考金融及云厂商最佳实践构建适合自身业务特点的SRE体系;

    ●  独立制定科学合理的SLI/SLO指标体系与错误预算政策,实现业务需求与技术实现的精准对齐,将SLO达成率提升至行业领先水平;

    ●  设计并实施统一监控与可观测性平台,整合Metric、Trace、Log等多维数据,运用Jaeger等工具实现故障分钟级定位与根因分析;

    ●  主导混沌工程常态化建设,策划并执行千级别演练场景,精准捕获高可用隐患,系统性提升系统反脆弱性与应急响应能力;

    ●  构建基于MTTx指标的故障管理体系,搭建ChatOps协同应急平台,实现P1事件自动回滚与专家蜂群式快速集结,大幅降低故障损失;

    ●  将AI/ML技术融入运维流程,通过日志分析、异常检测与智能算法实现预测性运维,结合大模型能力推动运维智能化转型;

    ●  推动SRE标准体系在组织落地,运用四步法完成现状评估、差距分析与认证准备,建立可持续改进的可靠性成熟度模型;

    ●  规划并建设全链路可观测性能力,分阶段实现数据互通、立体观测与智能洞察,为复杂分布式系统提供全景可观测视图。

    ●  获得职业资格认证,完成课程并通过考试的学员,将获得工信部教考中心颁发的《系统可靠性工程师(高级)》职业技术证书。

     

    【发证机构】

    工业和信息化部教育与考试中心(简称:工信部教考中心)是中国工业和信息化部下属的一个专门机构,主要负责组织实施工业和信息化领域的教育培训及资格考试工作。近年来,工信部教考中心在国家认证课程创新方面很多建树,例如之前主导的国家软考认证(即《计算机技术与软件专业技术资格(水平)考试认证》)得到了全国各行业的持续推广和广泛好评,成为软件教育方面的冠军认证。


    【课程内容】

    一、破冰之旅:自我介绍 & SRE基本概念

    二、 SRE原则与实践

    三、服务级别目标

    四、 监控与可观测性

    五、混沌工程

    六、构建安全和可靠的系统

    七、SRE和故障管理

    八、人工智能运维与DataOps

    九、SRE标准介绍

    十、SRE开源工具介绍与分析

    十一、全链路可观测性建设与案例分享