讲授专家:李勇 培训对象:证券行业战略规划、技术研发、投资研究、风控合规、客户服务等业务部门的管理及技术人员; 课程时间:1天 课程背景: Ø 本课程结合AI大模型技术革命与证券行业数字化转型的双重背景,聚焦DeepSeek的核心技术突破及其在证券行业的应用潜力,解析指令模型与推理模型的技术差异,探讨低成本、高性能AI对证券业务模式的重构逻辑,帮助学员从技术认知、应用场景到战略布局全面掌握AI驱动的行业变革趋势。 课程收益: 培训完结后,学员能够: 1.**理解DeepSeek的技术特性**:掌握其低成本、高效率的核心优势及技术实现路径。 2.**区分指令模型与推理模型**:明确两类模型的技术差异及在证券业务中的应用场景。 3.**预判AI技术趋势**:分析推理模型未来可能具备的复杂决策、动态交互能力及其对金融智能化的推动。 4.**评估行业影响**:识别DeepSeek对投资研究、客户服务、风险管理等核心业务的效率提升路径。 5.**规划成本与算力策略**:掌握AI大模型成本优化方法及算力需求变化趋势。 6.**制定应对策略**:结合开源生态与行业竞争格局,设计证券机构的AI技术应用路线图。 两天培训课程大纲: 单元 | | | | | 1. DeepSeek的技术架构解析* 1.1) MOE(专家混合模型)与MLA(多头潜在注意力)算法的创新。 1.2) 参数规模与算力效率:V3模型6710亿参数中仅激活370亿,训练成本557万美元的颠覆性意义。 **案例**:对比Meta Llama3与DeepSeek-V3的算力需求差异(H800 GPU数量减少87.5%)。 **讨论课题**:证券机构如何通过低成本AI模型降低技术投入门槛? 2. 性能评测与商业化潜力 2.1) 在MMLU、DROP等评测中超越GPT-4o的关键表现。 2.2) 开源模式对OpenAI闭源垄断的挑战:技术民主化与生态共建。 | | | 1. 指令模型的核心逻辑 1.1) 基于用户指令生成结果,强调任务执行的准确性(如传统GPT系列)。 1.2) 局限性:缺乏动态推理过程,依赖大量监督微调数据。 2. 推理模型的范式革新 2.1) DeepSeek-R1的强化学习训练:跳过监督微调,直接通过逻辑链生成解决方案。 2.2) 关键能力:文档分析、数学推理、代码生成(AIME2024测试成绩79.8% vs. OpenAI-o1的96.7%)。 **案例**:某券商测试中利用DeepSeek-R1优化量化交易策略的回测效率。 | | | 1. 投资研究与资产管理 1.1) 自动化研报生成与多因子模型优化。 1.2) 实时市场情绪分析与事件驱动策略。 2. 客户服务与合规风控 2.1) 智能投顾的交互式决策支持(如“思考过程”可视化)。 2.2) 反洗钱与异常交易识别的动态推理能力提升。 **案例**:奇安信利用DeepSeek-R1实现安全威胁研判效率提升30%。 | | | 1. DeepSeek对算力生态的影响 1.1) 训练成本降低20%-40%对资本支出的释放效应。 1.2) 推理算力需求增长:从训练密集型向应用密集型的转变。 2. 证券行业的算力策略 2.1) 混合云部署与国产算力替代(如海光信息、浪潮信息)。 **讨论课题**:如何平衡推理算力需求与GPU供应链风险? | | | 1. OpenAI与DeepSeek的路线之争 1.1) 闭源收费 vs. 开源生态:技术壁垒与商业化闭环的博弈。 2. 证券机构的开源策略** 2.1) 参与社区共建 vs. 自主模型微调的路径选择。 **案例**:阿里云、腾讯云快速集成DeepSeek模型的开源实践。 3、企业部署模型和使用模型的成本将大大降低。 | | | 1. 复杂决策与动态交互能力 1.1) 多模态融合:文本、数据、图表联动的投资决策支持。 1.2) 实时自适应学习:基于市场波动的策略动态调整。 2. 伦理与风险挑战 2.1) 模型幻觉的进一步降低与可解释性提升。 2.2) 监管科技(RegTech)与AI合规框架的协同演进。 | | | 1. AI大模型的时代下复合型人才需求的持续攀升 2. 要求学习能力越来越强,尤其是对技术逻辑、 业务理解和技术工具的使用能力。 3、某些工作流程的重塑可能性 |
|