|
DeepSeek与大模型全技术解析 西安交大数字经济研究院首席科学家/深圳市人工智能协会特邀专家 课程背景 随着大模型技术的广泛应用,企业面临“用不好”“落不下”的现实挑战。本课程围绕最新的大模型算法原理、RAG检索增强技术、Agent智能体开发、微调训练路径以及AI赋能研发效率的实战路径展开,旨在帮助参训人员系统掌握大模型应用的核心逻辑与工程落地路径。 课程融合了DeepSeek、Dify、llamafactory、Ollama等先进工具与平台的使用方法,涵盖从知识库构建、提示词工作流、模型微调到研发自动化的全过程,特别强调“从理解到交付”的闭环技能训练。 课程收益 理解核心算法与创新点:掌握DeepSeek算法解析、RAG技术原理及检索模块优化策略; 具备Agent开发实操能力:掌握Dify的部署、智能体五要素及MCP场景调用; 掌握模型微调与训练路径:理解llama factory的使用方法,熟悉多模态与强化微调技术; 实现研发效率跃升:通过AI辅助代码生成、测试、Review、CI/CD接入等,显著提升团队交付能力; 建立完整工具链视角:了解主流大模型工具如Ollama、Cursor、Jenkins、MCP的实际应用路径。 课程对象 研发团队负责人 / 架构师 / AI工程师 企业内训师、AI项目经理、智能产品经理 希望将大模型技术落地到研发与运维环节的技术管理人员 正在搭建私有化大模型能力或智能体产品的实战团队 课程模型
时长:1天 课程大纲: 一、AI大模型的能力边界1.1 AI基础知识:基本概念、发展历程、工作原理、关键技术1.2 主流AI模型介绍及应用:ChatGPT、Claude、Gemini、Deepseek、千问1.3 AI模型本地化部署:服务器部署,移动端部署1.4 数据安全和隐私保护策略 1.5大模型能力利用:意图识别、ICL(上下文学习)、COT(思维链)、IF(指令遵循)1.6大模型能力局限:缺乏领域知识,缺乏复杂多步推理 1.7大模型及应用安全专题:架构安全、网络安全、数据安全 1.8周边影响:核心硬件+AI数据中心建设+云计算给AI带来的影响 二、基于大模型的Agent开发 2.1 Agent概念和应用 Dify的本地化部署 Dify搭建智能化工作流 常见插件解析 工作流解析 MCP概念和应用 【案例】调用MCP案例 实践:智能体的五大元素-模型、插件、知识库、工作流、提示词 2.2提示词介绍 1. Prompt的一个本质 2. Prompt的二个心法 3. Prompt的三项沟通要点 4. Prompt的四项chat法则 5. Prompt的五个业务法则 6. Prompt的六条咒语 7. Prompt的七项注意 8 .Prompt的天龙八部 9. Prompt的追问法则 10. Prompt的继续法则 三、大模型训练与微调实践 1、微调与RAG应用场景对比大模型微调算法概述 2、微调工具llama factory概述微调方法和检查点路径 3、主要训练参数调整:量化等级、量化方法、加载方式、学习率、训练轮数、最大梯度范数、最大样本数、计算类 型、截断长度、批处理大小、梯度累积、验证集比例、学习率时间器验证 和预测模型导出 【案例】使用llama factory进行模型微调 【案例】微调前后效果对比【案例】多模态模型微调方法 强化微调技术 大模型部署工具Ollama应用 大模型调用的几种方式 【案例】一键式调用大模型 四、大模型赋能研发效率提升实践 基于大模型的agent开发 AI大模型技术在研发全流程中的应用 大模型需求文档评审与理解 【案例】大模型理解需求并生成代码 【案例】利用Cursor自动生成代码 【案例】大模型进行自动化code review 【案例】白盒测试代码生成并集成至CI流水线 【案例】接口自动化测试代码生成 【案例】大模型实现提交代码分布等级质量评估反馈 【案例】大模型生成Jenkins groovy脚本构建CI pipeline 【案例】大模型根据历史数据做流量预测 【案例】大模型智能路由 【案例】大模型生成网络关系分析 【案例】大模型智能故障诊断 【案例】大模型智能恢复障碍
|