人工智能工程师(高级)课程旨在为开发者提供一套系统化的大语言模型(LLM)应用开发路线图。课程从 LLM 处理自然语言的底层机制切入,深入讲解基础对话应用的架构设计;随后重点攻克检索增强生成(RAG)技术,从核心原理、提示工程优化到系统评估与性能调优,建立完整的知识库应用开发能力;
人工智能工程师(高级)课程旨在为开发者提供一套系统化的大语言模型(LLM)应用开发路线图。课程从 LLM 处理自然语言的底层机制切入,深入讲解基础对话应用的架构设计;随后重点攻克检索增强生成(RAG)技术,从核心原理、提示工程优化到系统评估与性能调优,建立完整的知识库应用开发能力;进而通过构建自主智能体(Agents)实现复杂任务的自动化处理;最后通过模型微调(Fine-tuning)技术,掌握低成本定制高性能领域模型的方法。通过本课程的学习,学员将具备独立设计并落地企业级 AI 应用的核心能力。
【课程目标】
通过本课程的学习,学员将能够:
掌握核心架构:深刻理解 LLM 工作原理,构建具备流式响应与多轮上下文记忆能力的对话系统。
精通 RAG 技术:搭建高性能的向量检索系统,解决模型知识滞后与幻觉问题,处理动态私密数据。
实施工程化评估:建立基于 Ragas 等框架的自动化评估体系,通过数据驱动的方式持续优化应用性能。
构建自主智能体:开发具备任务拆解、工具调用与多智能体协作能力的 AI Agent,解决复杂业务问题。
定制领域模型:掌握 LoRA 等参数高效微调技术,针对特定垂直领域优化模型表现。
AI 应用开发者:希望从传统软件开发转型,掌握 LLM 应用架构设计与落地的工程师。
算法工程师/数据科学家:希望深入理解工程化落地(RAG、Agents)及微调实战的技术人员。
技术架构师:负责企业级 AI 系统选型、架构设计与技术攻坚的团队负责人。
高阶技术产品经理:需要深入理解技术边界,以便更好地定义 AI 产品功能与逻辑的 PM。
学员前置要求:
编程语言基础:具备 Python 编程基础,熟悉基本语法与数据结构,能够阅读并理解 Python 代码逻辑。
实验环境准备:
(1)课程提供全套基于 Python 的 Jupyter Notebook 实战代码库。
(2)学员需具备运行 Jupyter Notebook 的本地或云端环境(如 VS Code、JupyterLab 或 Google Colab)。
API 资源准备:
(1)为确保实战环节的顺利进行,强烈建议学员在课前申请并准备好 LLM API Key。
(2)推荐平台:建议优先注册 DeepSeek 或 硅基流动(SiliconFlow) 平台,这两个平台提供稳定且高性能的模型服务,能够完美适配课程中的实验案例。
【课程内容】
第一天学习内容:
第一章:LLM 应用架构与基础开发
学习目标:掌握大语言模型处理自然语言的核心机制,构建具备上下文感知能力的基础对话应用,并建立初步的伦理风控意识。
● LLM 运行机制解析:深入理解 LLM 处理自然语言查询的原理与流程。
● 任务型机器人构建:实战开发任务优先级排序机器人,掌握指令遵循与逻辑处理。
● 伦理与风险控制:识别 AI 应用中的伦理陷阱,规避如不合理排程导致的过劳等潜在风险。
● 流式交互体验:实现流式响应(Streaming Response),打造自然的对话交互体验。
● 多轮会话管理:设计上下文记忆机制,实现跨轮次的连贯交互。
● 系统提示工程:掌握 System Prompt 的设计原则,精准定义与约束 AI 的行为边界。
第二章:检索增强生成(RAG)核心技术
学习目标:通过 RAG 技术解决模型知识滞后与幻觉问题,构建基于私有数据的问答系统。
● RAG 原理与价值:理解 RAG 如何突破预训练模型的知识边界,弥合信息鸿沟。
● 向量检索系统构建:掌握文本嵌入(Embeddings)技术与向量数据库的使用,搭建文档检索系统。
● 上下文注入策略:学习如何将检索到的知识高效注入提示词,生成有据可依的回答。
● 动态数据处理:处理私密数据、动态更新信息及高频变动内容的检索策略。
第三章:面向 RAG 的高级提示工程
学习目标:利用高级提示技巧优化 RAG 系统的输出质量,建立自动化评估与优化机制。
● 上下文引导策略:设计提示模板,引导 LLM 准确理解并利用检索到的上下文信息。
● 结构化提示框架:运用 Role-Goal-Context-Audience-Format-Guardrails 框架设计高鲁棒性系统提示。
● 高级推理技巧:掌握角色扮演(Persona)、少样本学习(Few-Shot)与链式思维(CoT)等进阶技巧。
● 提示词自动化优化:使用元提示(Meta Prompting)技术实现提示词的自我迭代与改进。
● 自动化裁判系统:应用“LLM-as-a-Judge”技术,实现生成结果的自动化打分与评估。
第二天学习内容:
第四章:RAG 系统评估与诊断
学习目标:建立科学的 RAG 评估体系,掌握从人工调试到自动化测试的全流程方法论。
● 评估方法论转型:理解从人工调试向规模化自动化评估转型的必要性与局限性。
● 故障定位与诊断:学习逐步检查 RAG 流水线(Pipeline),精准定位性能瓶颈。
● 核心评估指标:掌握上下文召回率、精度、事实一致性与答案正确性等关键维度。
● 自动化评估实战:搭建并使用 Ragas 框架,对 RAG 系统进行全自动性能测试。
● 指标解读与改进:基于评估数据提炼可执行洞见,驱动 RAG 系统的持续优化。
● 评估框架选型:对比主流 RAG 评估框架,建立专家参与的可持续评估流程。
第五章:RAG 性能优化进阶
学习目标:针对复杂场景优化检索与生成环节,显著提升 RAG 系统的准确性与鲁棒性。
● 检索能力增强:提升检索环节的准确度与相关性,确保知识获取的精准性。
● 生成质量控制:减少因上下文缺失或噪声干扰导致的幻觉与错误回答。
● 复杂查询处理:优化模型对模糊、复杂及多意图查询的理解与拆解能力。
● 流水线综合调优:通过全链路优化,输出更具实用价值与依据的回答。
第六章:构建自主智能体(Agents)
学习目标:开发具备自主决策能力的 AI Agent,实现复杂任务的拆解、工具调用与多智能体协作。
● 复杂目标规划:学习将抽象业务目标拆解为可执行的具体步骤序列。
● 决策智能体开发:构建能够根据用户输入自主判断路径的智能体。
● 多智能体编排:设计协同机制,编排多个专用智能体共同完成复杂任务。
● 工具与 API 集成:赋予智能体使用外部工具及获取实时数据的能力。
● 方案整合输出:将多步骤执行结果整合成连贯、易读的最终方案。
第七章:大模型微调(Fine-tuning)实战
学习目标:掌握模型微调的核心原理与操作流程,通过低成本方式定制高性能领域模型。
● 微调核心原理:深入理解损失函数、梯度下降及训练动态等底层逻辑。
● 技术路线选择:辨析预训练与微调的区别,明确微调在模型定制中的适用场景。
● 参数高效微调(PEFT):实战 LoRA(低秩适配)技术,降低显存占用与训练成本。
● 训练状态诊断:通过分析训练集与验证集损失,识别欠拟合、过拟合及收敛状态。
● 超参数调优:通过调整学习率、秩(Rank)及 Epochs 等参数迭代优化模型性能。
● 模型评估与部署:在基准任务上评估微调效果,掌握 LoRA 权重的动态加载与融合部署。
考试时长:60分钟
考试地点:线上考试
考试形式:闭卷考试
考试题型:单选题
考题数量:50题
通过分数:满分为100分,通过分数线为70分。考生必须至少答对35题 (即70%的正确率)
人工智能工程师(高级)课程旨在为开发者提供一套系统化的大语言模型(LLM)应用开发路线图。课程从 LLM 处理自然语言的底层机制切入,深入讲解基础对话应用的架构设计;随后重点攻克检索增强生成(RAG)技术,从核心原理、提示工程优化到系统评估与性能调优,建立完整的知识库应用开发能力;进而通过构建自主智能体(Agents)实现复杂任务的自动化处理;最后通过模型微调(Fine-tuning)技术,掌握低成本定制高性能领域模型的方法。通过本课程的学习,学员将具备独立设计并落地企业级 AI 应用的核心能力。
【课程目标】
通过本课程的学习,学员将能够:
掌握核心架构:深刻理解 LLM 工作原理,构建具备流式响应与多轮上下文记忆能力的对话系统。
精通 RAG 技术:搭建高性能的向量检索系统,解决模型知识滞后与幻觉问题,处理动态私密数据。
实施工程化评估:建立基于 Ragas 等框架的自动化评估体系,通过数据驱动的方式持续优化应用性能。
构建自主智能体:开发具备任务拆解、工具调用与多智能体协作能力的 AI Agent,解决复杂业务问题。
定制领域模型:掌握 LoRA 等参数高效微调技术,针对特定垂直领域优化模型表现。
AI 应用开发者:希望从传统软件开发转型,掌握 LLM 应用架构设计与落地的工程师。
算法工程师/数据科学家:希望深入理解工程化落地(RAG、Agents)及微调实战的技术人员。
技术架构师:负责企业级 AI 系统选型、架构设计与技术攻坚的团队负责人。
高阶技术产品经理:需要深入理解技术边界,以便更好地定义 AI 产品功能与逻辑的 PM。
学员前置要求:
编程语言基础:具备 Python 编程基础,熟悉基本语法与数据结构,能够阅读并理解 Python 代码逻辑。
实验环境准备:
(1)课程提供全套基于 Python 的 Jupyter Notebook 实战代码库。
(2)学员需具备运行 Jupyter Notebook 的本地或云端环境(如 VS Code、JupyterLab 或 Google Colab)。
API 资源准备:
(1)为确保实战环节的顺利进行,强烈建议学员在课前申请并准备好 LLM API Key。
(2)推荐平台:建议优先注册 DeepSeek 或 硅基流动(SiliconFlow) 平台,这两个平台提供稳定且高性能的模型服务,能够完美适配课程中的实验案例。
【课程内容】
第一天学习内容:
第一章:LLM 应用架构与基础开发
学习目标:掌握大语言模型处理自然语言的核心机制,构建具备上下文感知能力的基础对话应用,并建立初步的伦理风控意识。
● LLM 运行机制解析:深入理解 LLM 处理自然语言查询的原理与流程。
● 任务型机器人构建:实战开发任务优先级排序机器人,掌握指令遵循与逻辑处理。
● 伦理与风险控制:识别 AI 应用中的伦理陷阱,规避如不合理排程导致的过劳等潜在风险。
● 流式交互体验:实现流式响应(Streaming Response),打造自然的对话交互体验。
● 多轮会话管理:设计上下文记忆机制,实现跨轮次的连贯交互。
● 系统提示工程:掌握 System Prompt 的设计原则,精准定义与约束 AI 的行为边界。
第二章:检索增强生成(RAG)核心技术
学习目标:通过 RAG 技术解决模型知识滞后与幻觉问题,构建基于私有数据的问答系统。
● RAG 原理与价值:理解 RAG 如何突破预训练模型的知识边界,弥合信息鸿沟。
● 向量检索系统构建:掌握文本嵌入(Embeddings)技术与向量数据库的使用,搭建文档检索系统。
● 上下文注入策略:学习如何将检索到的知识高效注入提示词,生成有据可依的回答。
● 动态数据处理:处理私密数据、动态更新信息及高频变动内容的检索策略。
第三章:面向 RAG 的高级提示工程
学习目标:利用高级提示技巧优化 RAG 系统的输出质量,建立自动化评估与优化机制。
● 上下文引导策略:设计提示模板,引导 LLM 准确理解并利用检索到的上下文信息。
● 结构化提示框架:运用 Role-Goal-Context-Audience-Format-Guardrails 框架设计高鲁棒性系统提示。
● 高级推理技巧:掌握角色扮演(Persona)、少样本学习(Few-Shot)与链式思维(CoT)等进阶技巧。
● 提示词自动化优化:使用元提示(Meta Prompting)技术实现提示词的自我迭代与改进。
● 自动化裁判系统:应用“LLM-as-a-Judge”技术,实现生成结果的自动化打分与评估。
第二天学习内容:
第四章:RAG 系统评估与诊断
学习目标:建立科学的 RAG 评估体系,掌握从人工调试到自动化测试的全流程方法论。
● 评估方法论转型:理解从人工调试向规模化自动化评估转型的必要性与局限性。
● 故障定位与诊断:学习逐步检查 RAG 流水线(Pipeline),精准定位性能瓶颈。
● 核心评估指标:掌握上下文召回率、精度、事实一致性与答案正确性等关键维度。
● 自动化评估实战:搭建并使用 Ragas 框架,对 RAG 系统进行全自动性能测试。
● 指标解读与改进:基于评估数据提炼可执行洞见,驱动 RAG 系统的持续优化。
● 评估框架选型:对比主流 RAG 评估框架,建立专家参与的可持续评估流程。
第五章:RAG 性能优化进阶
学习目标:针对复杂场景优化检索与生成环节,显著提升 RAG 系统的准确性与鲁棒性。
● 检索能力增强:提升检索环节的准确度与相关性,确保知识获取的精准性。
● 生成质量控制:减少因上下文缺失或噪声干扰导致的幻觉与错误回答。
● 复杂查询处理:优化模型对模糊、复杂及多意图查询的理解与拆解能力。
● 流水线综合调优:通过全链路优化,输出更具实用价值与依据的回答。
第六章:构建自主智能体(Agents)
学习目标:开发具备自主决策能力的 AI Agent,实现复杂任务的拆解、工具调用与多智能体协作。
● 复杂目标规划:学习将抽象业务目标拆解为可执行的具体步骤序列。
● 决策智能体开发:构建能够根据用户输入自主判断路径的智能体。
● 多智能体编排:设计协同机制,编排多个专用智能体共同完成复杂任务。
● 工具与 API 集成:赋予智能体使用外部工具及获取实时数据的能力。
● 方案整合输出:将多步骤执行结果整合成连贯、易读的最终方案。
第七章:大模型微调(Fine-tuning)实战
学习目标:掌握模型微调的核心原理与操作流程,通过低成本方式定制高性能领域模型。
● 微调核心原理:深入理解损失函数、梯度下降及训练动态等底层逻辑。
● 技术路线选择:辨析预训练与微调的区别,明确微调在模型定制中的适用场景。
● 参数高效微调(PEFT):实战 LoRA(低秩适配)技术,降低显存占用与训练成本。
● 训练状态诊断:通过分析训练集与验证集损失,识别欠拟合、过拟合及收敛状态。
● 超参数调优:通过调整学习率、秩(Rank)及 Epochs 等参数迭代优化模型性能。
● 模型评估与部署:在基准任务上评估微调效果,掌握 LoRA 权重的动态加载与融合部署。
考试时长:60分钟
考试地点:线上考试
考试形式:闭卷考试
考试题型:单选题
考题数量:50题
通过分数:满分为100分,通过分数线为70分。考生必须至少答对35题 (即70%的正确率)