2025年6月26日,第三届中国大会在上海成功举办。本次会议由LF AI&DATA RUG与COIA作为指导单位,雅菲奥朗和观测云联合主办, PeopleCert,亚马逊云科技、中关村人才协会SRE专委会等单位协办。会议邀请了来自运营商、金融、医疗、高端制造、互联网行业等120余位SRE领域专业人士,共同探讨在数字经济时代下,如何通过技术创新和最佳实践提升企业的系统稳定性和运维效率,以及共同分享在SRE、、AI人工智能领域的最新发展、创新和未来趋势。
2025第三届中国SRE大会
本次会议特别邀请了PeopleCert中国区业务负责人Andrew、观测云VP蔡文瑜作开场致辞。
PeopleCert中国区业务负责人Andrew
PeopleCert中国区业务负责人Andrew介绍到,SRE的概念诞生于2000年初,旨在通过软件工程的方式解决运维问题,确保大规模分布式系统的高可用性、可靠性和可扩展性。随着中国在互联网、金融、电信、电商等领域的快速发展,高可用性、高稳定性、自动化运维能力的需求持续攀升,SRE因而正迅速成为现代IT运维的主流模式。
作为全球领先的专业认证机构,PeopleCert始终走在技能标准化与职业认证的前沿。在收购 Institute后,我们已将其旗下一系列SRE认证项目纳入PeopleCert整体认证框架之中,并构建出一套面向未来IT组织的知识图谱和认证体系。
Andrew强调,当前中国正处于云计算、AI、智能运维等新技术融合加速的阶段,越来越多企业也开始重视SRE人才培养与体系建设。特别感谢雅菲奥朗作为PeopleCert在中国的官方授权合作伙伴,在SRE认证引入、课程本土化和讲师培养等方面做出的巨大贡献,并帮助诸多中国企业客户建立起符合国际标准的SRE能力框架。
未来,PeopleCert将继续投入资源,推动SRE、 DevOps、AIOps、Observability等认证内容的更新与本地化, 联动更多合作伙伴,共建面向云时代的新型IT人才生态。
观测云VP蔡文瑜
观测云VP蔡文瑜在开场致辞中提到,他回顾了自己 20 年的运维行业经历,在当前云化、在线化和 AI 化的大背景下,行业的范式正在快速变革中,SRE 正在打破传统框架,创造新规则。
他提到,观测云的客户们在各领域展现出的创新实践令他深受触动,监控对象的边界已经不仅限于算力、存储、网络和应用,包括用户行为、各种新型 IoT 设备、业务平台等也被广泛纳入统一监控体系,SRE 工程师们经常会面对分布在全球的海量设备池与数据湖管理需求,这在传统领域里很难想象,所以可观测性软件厂商应以学习者和探索者的心态向工程师们靠拢,做好工具,助力行业发展。
蔡文瑜表示,本次大会邀请到众多行业专家,共同分享与讨论 SRE 在 AI、可观测性等前沿领域的最新成果与发展前景,希望大家共同探索新时代 SRE 之道。
刘峰 PeopleCert SRE官方大使、雅菲奥朗总经理
PeopleCert SRE官方大使、雅菲奥朗总经理刘峰,带来了一场主题为《SRE新发展一A1、可观测和未来》的精彩演讲。刘峰从最近的某云厂商宕机事件出发,强调了系统可靠运维的重要性。他指出,SRE实践从工程化运维起步,现已融入混沌工程、DevOps等先进理念,以平衡系统的多维度需求。AI技术的应用,为SRE领域带来了革命性的变化,特别是在监控、故障诊断、性能预测等方面,实现了智能决策,极大地提升了运维效率和系统稳定性。他进一步阐述了可观测性在SRE中的关键作用。通过提供系统透明的数据,可观测性与AI技术的融合催生了自动化修复、架构智能优化等新模式,为SRE实践带来了新的发展方向。此外,刘峰还介绍了SRE国际认证课程体系,这一体系旨在全面培养SRE领域的专业人才,为行业输送新鲜血液,推动SRE实践的持续进步。刘峰老师的演讲不仅为与会者提供了深刻的见解,也为SRE领域的未来发展指明了方向。
黄小龙 观测云产品技术总监
观测云产品技术总监黄小龙就《下一代智能可观测性平台技术实践》进行了精彩的演讲。黄小龙指出,许多企业在构建监控体系时采用了“烟囱式”方法,导致长期存在协同成本高和数据割裂的问题。这种割裂式的技术体系已经无法支撑 AI 时代对实时性、智能性和协同能力的更高要求。为此,观测云提出了“智能一体化可观测性平台”的方向,旨在通过统一的数据基础、查询语言和分析入口,替代冗余工具堆叠,解决现有问题。在演讲中,黄小龙老师详细介绍了智能一体化可观测性平台的技术要素,强调了打破数据孤岛、建立统一的可观测性智能体的重要性,并展望了面向全球的持续进化的可观测性平台的发展前景。他的演讲为与会者提供了宝贵的见解,强调了可观测性不仅仅是监控,展示了如何通过技术创新提升系统的可观测性。
曹付江 中国移动磐基CMChaos混沌平台技术专家、总教练
中国移动磐基CMChaos混沌平台技术专家、总教练曹付江在会上发表了题为《混沌工程在大型运营商的落地实践》的演讲。曹付江首先介绍了新一代SRE与混沌工程,强调了在大模型与AI驱动的时代,SRE已经从单纯的监控、告警与事故响应,升级为“智能化可靠性工程”。他详细阐述了混沌工程的演进过程,从简单的故障注入发展为“AI辅助的自适应演练”。他分享了企业如何落地混沌工程并与SRE融合的经验,利用大模型自动生成实验方案、分析异常模式,使系统韧性验证更科学、更高效。他还展示了移动磐基CMChaos混沌平台的优势及其在大型运营商中的应用成效,强调了结合SRE的度量、观测和流程与混沌工程演练的重要性。曹付江的演讲为与会者提供了新视角,稳定高于一切,主动胜于被动,混沌不是终点,而是韧性进化论的开始。
PeopleCert"SRE优秀实践"颁奖仪式
国内SRE的发展,离不开各位专家的鼎力支持。 PeopleCert特别设立了“SRE优秀实践”奖项,该奖项不仅是对获奖者个人专业能力的认可,更是对整个SRE领域发展的鼓励和推动。通过表彰SRE行业领导者的杰出成就,激励更多的专业人士投身于SRE实践,推动SRE领域的持续创新和发展。获奖人包括刘峰、晁元宁、杨文博、黄小龙、王刚等专家。
张浩炜 邻取智能科技有限公司运营总监
邻取智能柜的运营总监张浩炜分享了题为《智能柜系统可观测性实践
》的精彩演讲。随着智能柜行业的迅猛发展,系统复杂性和业务规模的不断扩大,传统的运维方式已难以满足现代智能柜系统的需求。张浩炜在演讲中详细介绍了邻取智能柜系统在可观测性建设方面的实践经验,包括监控体系设计、日志管理优化、链路追踪实现等核心技术方案。通过真实案例,张浩炜展示了实施可观测性实践后,故障发现时间缩短了80%,系统稳定性提升了90%的显著效果。这些成果不仅为智能柜行业的同仁们提供了宝贵的技术参考,也为整个行业提供了可观测性实践的最佳实践指导。他的演讲强调了可观测性在打造“会思考”的智能柜系统中的关键作用,为智能柜行业的未来发展指明了方向。他的分享不仅展示了可观测性在提升系统稳定性和运维效率方面的潜力,也为跨境电商平台系统对接提供了新的思路和解决方案。
PeopleCert"AI创新"颁奖仪式
AI人工智能作为当今世界最具变革性的技术之一,正在深刻改变着各行各业的发展格局。它不仅提升了生产效率,优化了业务流程,还为解决复杂问题提供了全新的思路和方法。PeopleCert"AI创新"奖项旨在表彰那些在人工智能领域做出杰出贡献、推动技术创新和应用实践的杰出个人和团队。获奖人包括李佐辉、崔伟、李筑聪、周闻钧和温德亮等专家。
周闻钧 智用开物 CTO
智用开物CTO周闻钧发表了题为《制造业AI演进的下一站》的演讲,深入探讨了在大语言模型引领的AI技术变革时代,智能体在企业级应用中的重要性。周闻钧指出,尽管大模型在技术上取得了显著进展,但它们并不足以单独支撑企业级应用的复杂需求。相反,智能体作为AI技术的新形态,能够更好地帮助企业实现数字化和智能化转型。他在演讲中强调,“每个环节都可能+AI,AI+能让决策站得更高。”他通过丰富的落地案例,详细梳理了企业AI应用落地的脉络,包括认知效率革命、创新成本降维,以及决策智能升级。这些案例展示了智能体如何在制造业中实现具体的应用,从而提升企业的运营效率和创新能力。此外,周闻钧还探讨了DeepSeek等大模型技术的局限性,并解释了智能体为何能够成为制造业AI演进的下一站。他的演讲为制造业的数字化转型提供了宝贵的指导,预示着智能体在AI技术演进中的重要角色和广阔前景。
李筑聪 联续边界创始人、复旦AI博士、
联续边界创始人、复旦AI博士李筑聪带来了一场题为《开启智能体驱动的AI自动化时代》的精彩演讲,深入探讨了智能体驱动的AI自动化时代的到来。李筑聪指出,通过组织形式创新、多智能体协作和开放生态,可以激发新质生产力。与传统自动化相比,AI智能体具备自主决策、动态协同和持续进化的能力,能够高效联接各类系统与数据,实现更智能的业务流程。在演讲中,他分享了智能体开发、服务与共享的实践经验,并结合具体产品案例,与行业同仁共探智能体技术的落地路径,助力企业迈向智能化未来。他强调,“AI智能体可以联接一切”,深刻揭示了智能体在AI自动化时代的重要作用。李筑聪的演讲得到了与会者的高度评价,他的见解和经验分享为智能体技术的发展提供了宝贵的指导。通过本次演讲,与会者对智能体驱动的AI自动化时代有了更深入的了解,也为企业如何利用智能体技术实现智能化转型提供了新的思路和方向。
圆桌论坛
在圆桌对话环节,围绕“AI时代的运维管理”的主题,来自中国移动磐基CMChaos混沌平台技术专家曹付江、浙江移动SRE负责人顾竞雄、邻取智能科技有限公司运营总监张浩炜、联续边界创始人、复旦AI博士李筑聪、智用开物 CTO周闻钧,以及主持人PeopleCert SRE官方大使、雅菲奥朗总经理刘峰共同探讨交流。
嘉宾们围绕着AI技术如何革新传统运维管理、提升系统稳定性和效率进行了深入交流。他们分享了各自在AI运维实践中的经验和见解,探讨了智能体、自动化运维工具以及大数据分析在现代运维中的作用。这场圆桌论坛不仅为与会者提供了前沿的行业洞察和思考方向,也为AI在运维管理中的应用指明了方向。
在雅菲奥朗、观测云、PeopleCert,亚马逊云科技、中关村人才协会SRE专委会等单位的鼎力支持下,第三届中国SRE大会在上海成功闭幕。本届大会以“新一代SRE:AI、可观测与未来”为核心议题,吸引了众多行业精英参与,共同探讨了SRE领域的最新发展和未来趋势。通过主旨演讲、圆桌讨论等多种形式,来自不同领域的优秀行业用户、权威专家和技术领袖分享了宝贵的SRE实践经验。这些讨论不仅展示了人工智能和可观测性在提升系统稳定性和运维效率方面的重要作用,也为SRE领域的未来发展提供了清晰的蓝图。
随着本届SRE大会的圆满结束,我们将继续致力于在国内推动SRE技术与实践的落地,将为更多行业提供创新与价值并重的技术实践参考,助力企业在数字化转型的浪潮中稳健前行。2025第三届SRE大会的成功举办,标志着SRE领域在中国的进一步发展和成熟。我们期待未来能有更多的专业人士加入到这一领域,共同推动SRE技术创新,为企业的数字化转型贡献力量。
关于雅菲奥朗
雅菲奥朗,成立于2018年的专业培训咨询机构,是国内知名的云计算和人工智能专家团队。公司秉承“以人为本”的理念,依托国际认证机构以及知名IT巨头(如惠普、微软)的顶级专家团队,专注于“AI时代”的IT培训与咨询。雅菲奥朗致力于帮助企业进行数字化转型,持续提升科技管理能力,助力企业赶超世界先进水平。
联系电话:021-53098865
雅菲奥朗培训官网:https://www.sretraining.cn
SRE专委会(中国SRE社区)官网:https://www.srenow.cn/