×
<在线客服<
描述
021-53098865


欢迎来到雅菲奥朗官网
欢迎来到雅菲奥朗官网
描述
SRE Foundation培训  
雅菲奥朗SRE Foundation课程介绍了使组织能够可靠和经济地扩展关键服务的原则和实践。SRE Foundation培训是为那些关注大规模服务可用性的学员量身定制的课程。雅菲奥朗携手DevOps Institute推出SRE Foundation认证培训,成为国内首家SRE授权培训和考试机构。
相关课程
  • 课程详情
  • 【课程概览】

    人工智能工程师(高级)课程旨在为开发者提供一套系统化的大语言模型(LLM)应用开发路线图。课程从 LLM 处理自然语言的底层机制切入,深入讲解基础对话应用的架构设计;随后重点攻克检索增强生成(RAG)技术,从核心原理、提示工程优化到系统评估与性能调优,建立完整的知识库应用开发能力;进而通过构建自主智能体(Agents)实现复杂任务的自动化处理;最后通过模型微调(Fine-tuning)技术,掌握低成本定制高性能领域模型的方法。通过本课程的学习,学员将具备独立设计并落地企业级 AI 应用的核心能力。

     

    【课程目标】


    通过本课程的学习,学员将能够:

    掌握核心架构:深刻理解 LLM 工作原理,构建具备流式响应与多轮上下文记忆能力的对话系统。

    精通 RAG 技术:搭建高性能的向量检索系统,解决模型知识滞后与幻觉问题,处理动态私密数据。

    实施工程化评估:建立基于 Ragas 等框架的自动化评估体系,通过数据驱动的方式持续优化应用性能。

    构建自主智能体:开发具备任务拆解、工具调用与多智能体协作能力的 AI Agent,解决复杂业务问题。

    定制领域模型:掌握 LoRA 等参数高效微调技术,针对特定垂直领域优化模型表现。

    【目标学员】

    • AI 应用开发者:希望从传统软件开发转型,掌握 LLM 应用架构设计与落地的工程师。

    • 算法工程师/数据科学家:希望深入理解工程化落地(RAG、Agents)及微调实战的技术人员。

    • 技术架构师:负责企业级 AI 系统选型、架构设计与技术攻坚的团队负责人。

    • 高阶技术产品经理:需要深入理解技术边界,以便更好地定义 AI 产品功能与逻辑的 PM。

     

    学员前置要求:

    • 编程语言基础:具备 Python 编程基础,熟悉基本语法与数据结构,能够阅读并理解 Python 代码逻辑。

    • 实验环境准备:

          (1)课程提供全套基于 Python 的 Jupyter Notebook 实战代码库。

          (2)学员需具备运行 Jupyter Notebook 的本地或云端环境(如 VS Code、JupyterLab 或 Google Colab)。

    • API 资源准备:

      (1)为确保实战环节的顺利进行,强烈建议学员在课前申请并准备好 LLM API Key。

      (2)推荐平台:建议优先注册 DeepSeek 或 硅基流动(SiliconFlow) 平台,这两个平台提供稳定且高性能的模型服务,能够完美适配课程中的实验案例。

     

    【课程内容】


    第一天学习内容:

    第一章:LLM 应用架构与基础开发

    学习目标:掌握大语言模型处理自然语言的核心机制,构建具备上下文感知能力的基础对话应用,并建立初步的伦理风控意识。

    ●  LLM 运行机制解析:深入理解 LLM 处理自然语言查询的原理与流程。

    ●  任务型机器人构建:实战开发任务优先级排序机器人,掌握指令遵循与逻辑处理。

    ●  伦理与风险控制:识别 AI 应用中的伦理陷阱,规避如不合理排程导致的过劳等潜在风险。

    ●  流式交互体验:实现流式响应(Streaming Response),打造自然的对话交互体验。

    ●  多轮会话管理:设计上下文记忆机制,实现跨轮次的连贯交互。

    ●  系统提示工程:掌握 System Prompt 的设计原则,精准定义与约束 AI 的行为边界。


    第二章:检索增强生成(RAG)核心技术

    学习目标:通过 RAG 技术解决模型知识滞后与幻觉问题,构建基于私有数据的问答系统。

    ●  RAG 原理与价值:理解 RAG 如何突破预训练模型的知识边界,弥合信息鸿沟。

    ●  向量检索系统构建:掌握文本嵌入(Embeddings)技术与向量数据库的使用,搭建文档检索系统。

    ●  上下文注入策略:学习如何将检索到的知识高效注入提示词,生成有据可依的回答。

    ●  动态数据处理:处理私密数据、动态更新信息及高频变动内容的检索策略。


    第三章:面向 RAG 的高级提示工程

    学习目标:利用高级提示技巧优化 RAG 系统的输出质量,建立自动化评估与优化机制。

    ●  上下文引导策略:设计提示模板,引导 LLM 准确理解并利用检索到的上下文信息。

    ●  结构化提示框架:运用 Role-Goal-Context-Audience-Format-Guardrails 框架设计高鲁棒性系统提示。

    ●  高级推理技巧:掌握角色扮演(Persona)、少样本学习(Few-Shot)与链式思维(CoT)等进阶技巧。

    ●  提示词自动化优化:使用元提示(Meta Prompting)技术实现提示词的自我迭代与改进。

    ●  自动化裁判系统:应用“LLM-as-a-Judge”技术,实现生成结果的自动化打分与评估。


    第二天学习内容:

    第四章:RAG 系统评估与诊断

    学习目标:建立科学的 RAG 评估体系,掌握从人工调试到自动化测试的全流程方法论。

    ● 评估方法论转型:理解从人工调试向规模化自动化评估转型的必要性与局限性。

    ● 故障定位与诊断:学习逐步检查 RAG 流水线(Pipeline),精准定位性能瓶颈。

    ● 核心评估指标:掌握上下文召回率、精度、事实一致性与答案正确性等关键维度。

    ● 自动化评估实战:搭建并使用 Ragas 框架,对 RAG 系统进行全自动性能测试。

    ● 指标解读与改进:基于评估数据提炼可执行洞见,驱动 RAG 系统的持续优化。

    ● 评估框架选型:对比主流 RAG 评估框架,建立专家参与的可持续评估流程。


    第五章:RAG 性能优化进阶

    学习目标:针对复杂场景优化检索与生成环节,显著提升 RAG 系统的准确性与鲁棒性。

    ● 检索能力增强:提升检索环节的准确度与相关性,确保知识获取的精准性。

    ● 生成质量控制:减少因上下文缺失或噪声干扰导致的幻觉与错误回答。

    ● 复杂查询处理:优化模型对模糊、复杂及多意图查询的理解与拆解能力。

    ● 流水线综合调优:通过全链路优化,输出更具实用价值与依据的回答。


    第六章:构建自主智能体(Agents)

    学习目标:开发具备自主决策能力的 AI Agent,实现复杂任务的拆解、工具调用与多智能体协作。

    ● 复杂目标规划:学习将抽象业务目标拆解为可执行的具体步骤序列。

    ● 决策智能体开发:构建能够根据用户输入自主判断路径的智能体。

    ● 多智能体编排:设计协同机制,编排多个专用智能体共同完成复杂任务。

    ● 工具与 API 集成:赋予智能体使用外部工具及获取实时数据的能力。

    ● 方案整合输出:将多步骤执行结果整合成连贯、易读的最终方案。


    第七章:大模型微调(Fine-tuning)实战

    学习目标:掌握模型微调的核心原理与操作流程,通过低成本方式定制高性能领域模型。

    ● 微调核心原理:深入理解损失函数、梯度下降及训练动态等底层逻辑。

    ● 技术路线选择:辨析预训练与微调的区别,明确微调在模型定制中的适用场景。

    ● 参数高效微调(PEFT):实战 LoRA(低秩适配)技术,降低显存占用与训练成本。

    ● 训练状态诊断:通过分析训练集与验证集损失,识别欠拟合、过拟合及收敛状态。

    ● 超参数调优:通过调整学习率、秩(Rank)及 Epochs 等参数迭代优化模型性能。

    ● 模型评估与部署:在基准任务上评估微调效果,掌握 LoRA 权重的动态加载与融合部署。

    【考试信息】

    考试时长:60分钟

    考试地点:线上考试

    考试形式:闭卷考试

    考试题型:单选题

    考题数量:50题

    通过分数:满分为100分,通过分数线为70分。考生必须至少答对35题    (即70%的正确率)


    【课程概览】

    人工智能工程师(高级)课程旨在为开发者提供一套系统化的大语言模型(LLM)应用开发路线图。课程从 LLM 处理自然语言的底层机制切入,深入讲解基础对话应用的架构设计;随后重点攻克检索增强生成(RAG)技术,从核心原理、提示工程优化到系统评估与性能调优,建立完整的知识库应用开发能力;进而通过构建自主智能体(Agents)实现复杂任务的自动化处理;最后通过模型微调(Fine-tuning)技术,掌握低成本定制高性能领域模型的方法。通过本课程的学习,学员将具备独立设计并落地企业级 AI 应用的核心能力。

     

    【课程目标】


    通过本课程的学习,学员将能够:

    掌握核心架构:深刻理解 LLM 工作原理,构建具备流式响应与多轮上下文记忆能力的对话系统。

    精通 RAG 技术:搭建高性能的向量检索系统,解决模型知识滞后与幻觉问题,处理动态私密数据。

    实施工程化评估:建立基于 Ragas 等框架的自动化评估体系,通过数据驱动的方式持续优化应用性能。

    构建自主智能体:开发具备任务拆解、工具调用与多智能体协作能力的 AI Agent,解决复杂业务问题。

    定制领域模型:掌握 LoRA 等参数高效微调技术,针对特定垂直领域优化模型表现。

    【目标学员】

    • AI 应用开发者:希望从传统软件开发转型,掌握 LLM 应用架构设计与落地的工程师。

    • 算法工程师/数据科学家:希望深入理解工程化落地(RAG、Agents)及微调实战的技术人员。

    • 技术架构师:负责企业级 AI 系统选型、架构设计与技术攻坚的团队负责人。

    • 高阶技术产品经理:需要深入理解技术边界,以便更好地定义 AI 产品功能与逻辑的 PM。

     

    学员前置要求:

    • 编程语言基础:具备 Python 编程基础,熟悉基本语法与数据结构,能够阅读并理解 Python 代码逻辑。

    • 实验环境准备:

          (1)课程提供全套基于 Python 的 Jupyter Notebook 实战代码库。

          (2)学员需具备运行 Jupyter Notebook 的本地或云端环境(如 VS Code、JupyterLab 或 Google Colab)。

    • API 资源准备:

      (1)为确保实战环节的顺利进行,强烈建议学员在课前申请并准备好 LLM API Key。

      (2)推荐平台:建议优先注册 DeepSeek 或 硅基流动(SiliconFlow) 平台,这两个平台提供稳定且高性能的模型服务,能够完美适配课程中的实验案例。

     

    【课程内容】


    第一天学习内容:

    第一章:LLM 应用架构与基础开发

    学习目标:掌握大语言模型处理自然语言的核心机制,构建具备上下文感知能力的基础对话应用,并建立初步的伦理风控意识。

    ●  LLM 运行机制解析:深入理解 LLM 处理自然语言查询的原理与流程。

    ●  任务型机器人构建:实战开发任务优先级排序机器人,掌握指令遵循与逻辑处理。

    ●  伦理与风险控制:识别 AI 应用中的伦理陷阱,规避如不合理排程导致的过劳等潜在风险。

    ●  流式交互体验:实现流式响应(Streaming Response),打造自然的对话交互体验。

    ●  多轮会话管理:设计上下文记忆机制,实现跨轮次的连贯交互。

    ●  系统提示工程:掌握 System Prompt 的设计原则,精准定义与约束 AI 的行为边界。


    第二章:检索增强生成(RAG)核心技术

    学习目标:通过 RAG 技术解决模型知识滞后与幻觉问题,构建基于私有数据的问答系统。

    ●  RAG 原理与价值:理解 RAG 如何突破预训练模型的知识边界,弥合信息鸿沟。

    ●  向量检索系统构建:掌握文本嵌入(Embeddings)技术与向量数据库的使用,搭建文档检索系统。

    ●  上下文注入策略:学习如何将检索到的知识高效注入提示词,生成有据可依的回答。

    ●  动态数据处理:处理私密数据、动态更新信息及高频变动内容的检索策略。


    第三章:面向 RAG 的高级提示工程

    学习目标:利用高级提示技巧优化 RAG 系统的输出质量,建立自动化评估与优化机制。

    ●  上下文引导策略:设计提示模板,引导 LLM 准确理解并利用检索到的上下文信息。

    ●  结构化提示框架:运用 Role-Goal-Context-Audience-Format-Guardrails 框架设计高鲁棒性系统提示。

    ●  高级推理技巧:掌握角色扮演(Persona)、少样本学习(Few-Shot)与链式思维(CoT)等进阶技巧。

    ●  提示词自动化优化:使用元提示(Meta Prompting)技术实现提示词的自我迭代与改进。

    ●  自动化裁判系统:应用“LLM-as-a-Judge”技术,实现生成结果的自动化打分与评估。


    第二天学习内容:

    第四章:RAG 系统评估与诊断

    学习目标:建立科学的 RAG 评估体系,掌握从人工调试到自动化测试的全流程方法论。

    ● 评估方法论转型:理解从人工调试向规模化自动化评估转型的必要性与局限性。

    ● 故障定位与诊断:学习逐步检查 RAG 流水线(Pipeline),精准定位性能瓶颈。

    ● 核心评估指标:掌握上下文召回率、精度、事实一致性与答案正确性等关键维度。

    ● 自动化评估实战:搭建并使用 Ragas 框架,对 RAG 系统进行全自动性能测试。

    ● 指标解读与改进:基于评估数据提炼可执行洞见,驱动 RAG 系统的持续优化。

    ● 评估框架选型:对比主流 RAG 评估框架,建立专家参与的可持续评估流程。


    第五章:RAG 性能优化进阶

    学习目标:针对复杂场景优化检索与生成环节,显著提升 RAG 系统的准确性与鲁棒性。

    ● 检索能力增强:提升检索环节的准确度与相关性,确保知识获取的精准性。

    ● 生成质量控制:减少因上下文缺失或噪声干扰导致的幻觉与错误回答。

    ● 复杂查询处理:优化模型对模糊、复杂及多意图查询的理解与拆解能力。

    ● 流水线综合调优:通过全链路优化,输出更具实用价值与依据的回答。


    第六章:构建自主智能体(Agents)

    学习目标:开发具备自主决策能力的 AI Agent,实现复杂任务的拆解、工具调用与多智能体协作。

    ● 复杂目标规划:学习将抽象业务目标拆解为可执行的具体步骤序列。

    ● 决策智能体开发:构建能够根据用户输入自主判断路径的智能体。

    ● 多智能体编排:设计协同机制,编排多个专用智能体共同完成复杂任务。

    ● 工具与 API 集成:赋予智能体使用外部工具及获取实时数据的能力。

    ● 方案整合输出:将多步骤执行结果整合成连贯、易读的最终方案。


    第七章:大模型微调(Fine-tuning)实战

    学习目标:掌握模型微调的核心原理与操作流程,通过低成本方式定制高性能领域模型。

    ● 微调核心原理:深入理解损失函数、梯度下降及训练动态等底层逻辑。

    ● 技术路线选择:辨析预训练与微调的区别,明确微调在模型定制中的适用场景。

    ● 参数高效微调(PEFT):实战 LoRA(低秩适配)技术,降低显存占用与训练成本。

    ● 训练状态诊断:通过分析训练集与验证集损失,识别欠拟合、过拟合及收敛状态。

    ● 超参数调优:通过调整学习率、秩(Rank)及 Epochs 等参数迭代优化模型性能。

    ● 模型评估与部署:在基准任务上评估微调效果,掌握 LoRA 权重的动态加载与融合部署。

    【考试信息】

    考试时长:60分钟

    考试地点:线上考试

    考试形式:闭卷考试

    考试题型:单选题

    考题数量:50题

    通过分数:满分为100分,通过分数线为70分。考生必须至少答对35题    (即70%的正确率)


课程天数:2天
 
SRE介绍了通过自动化、工作方法和组织重组的混合措施来提高服务可靠性的一系列实践。雅菲奥朗SRE Foundation是为那些关注大规模服务可用性的学员量身定制的课程。国际开发运维考试协会DevOps Institute(DOI)总部位于美国佛罗里达州,旨在推动前沿运维技术最佳实践和标准的全球普及与应用,DOI足迹已遍布全球30余个国家。DevOps Institute致力于帮助企业IT加快产品交付速度和实现数字化转型。DevOps Institute的认证课程主要涵盖DevOps,SRE,IT服务管理,敏捷服务管理(CASM)、持续交付、持续集成,DevSecOps(安全DevOps)及DevOps实践培训等。雅菲奥朗携手DevOps Institute推出SRE Foundation认证培训,成为国内首家SRE授权培训和考试机构。

一、为什么要学习SRE?
传统运维模式(Dev/Ops分离的团队模式)冲突的焦点:
战略层面:
1、直接成本相对清晰。
2、间接成本差异较大(背景、技术能力、工具习惯、工作目标)。
初步演变为目标与方向上的分歧以及内部沟通严重问题,上升到部门之间的信任与尊重。
战术层面:
传统研发团队和运维团队分歧的焦点主要在软件新版本、新配置的变更的发布速度上。
执行层面:
1、开发团队宣称不再进行大规模的程序更新,改为功能开关调整、增量更新和补丁化(大变更→小变更)。为了绕开运维团队设立的各种流程,从而更快地上线新功能。
2、绕过运维团队设立的新服务/变更发布流程,新功能上线速度是加快了,但事件仍在重现,使得服务质量很差。
冲突解决之道:SRE
SRE模型的优势:
1)运维人数相对少;
2)开发团队和运维团队的冲突焦点消除;
3)促进产品部门水平提高,因为SRE团队和研发团队之间的成员可以自由流动。

二、SRE Foundation课程的学习内容
SRE(Site Reliability Engineering)Foundation℠课程介绍了使组织能够可靠和经济地扩展关键服务的原则和实践。引入站点可靠性维度需要组织重新调整、对软件工程和自动化的关注以及采用一系列新的工作模式。
SRE课程强调了SRE的发展及其未来的方向,并为参与者提供了实践、方法和工具,让整个组织的人员都参与到可靠性和稳定性中,通过使用真实场景和案例故事证明了这一点。课程结束后,学员将有切实的收获,例如理解、设置和跟踪服务水平目标(SLO)。
该课程是通过利用关键的SRE资源,与SRE领域的思想领袖接触,并与支持SRE的组织合作,以提取现实生活中的最佳实践而开发的,旨在教授开始采用SRE所必需的关键原则和实践。本课程使学习者能够顺利完成SRE基础认证考试。

三、SRE Foundation课程的学习目标
1、SRE基础课程的学习目标包括实际了解:
2、SRE的历史及其在谷歌的出现
3、SRE与DevOps和其他流行框架的相互关系
4、SRE背后的基本原则
5、服务水平目标(SLO)及其用户关注点
6、服务水平指标(SLI)和现代监控环境
7、错误预算和相关的错误预算政策
8、人力及其对组织生产力的影响
9、有助于消除琐事的实际步骤
10、可观察性,表明服务的健康状况
11、SRE工具、自动化技术和安全重要性
12、反脆弱性,我们对失效和失效测试的方法
13、引入SRE带来的组织影响

四、SRE Foundation课程的目标学员
DevOps从业人员
任何对现代IT领导和组织变革方法感兴趣的人
业务经理
商业利益相关者
顾问
IT主管
IT经理
IT团队领导
产品负责人
Scrum大师
软件工程师
现场可靠性工程师
系统集成商
工具供应商

五、SRE Foundation课程的教学模式
16小时的讲师指导培训
课堂练习和讨论
行业案例故事
作业练习

六、参加SRE Foundation课程的收获
SRE代表了对行业现存管理大型复杂服务的最佳实践的一个重要突破,由于Google目前的全球领先地位,SRE模式可以为广大企业提供深度模仿或借鉴。
对于企业客户而言,通过学习和掌握SRE课程,将带来以下收获:
1. 国际知名的DevOps Institute学院(DOI)推出的SRE认证课程代表了这个领域的最新知识体系,学习课程可以明显提高团队人员知识水平和创新能力;
2. 此次课程可以帮助现有的SRE团队将现有的SRE实践和国际理论标准结合,强化SRE实践能力;
3. 课程可以帮助团队掌握SRE四个关键价值(1.一套指导思想、2.一套方法论、3.一套激励方法、4.一个专业能力发展);
4. 学习后将安排认证考试,通过后可获得DOI的官方认证,可以大大提升团队信心;
5. 2020年是SRE课程为国内第一批,认证证书也将是国内首批发放,实施后将明显提升公司在SRE方面的社会公信力和公司品牌形象。

七、雅菲奥朗SRE课程,讲什么?
1. 互联网时代的IT运维精英能力分析
2. 如何成为稀缺高薪SRE人才
3. Google SRE起源与实践总结
4. SRE自动化实践
5. 服务水平目标和错误预算
6. 减少琐事(TOIL)
7. 监控和服务水平指标
8. SRE工具及自动化
9. 反脆弱性和从失败中学习
10. SRE框架和发展趋势

雅菲奥朗SRE Foundation认证培训