让天下没有难找的讲师,职业讲师,商业讲师,培训师,讲师库-北京昭智教育

傅一航:Python数据建模(时序模型篇)

[复制链接]
Python数据建模(时序模型篇)
【课程目标】
本课程为高级课程《Python数据建模》的第二篇:时序篇
本课程主要讲解如何利用Python进行时间序列的数据建模,帮助学员构建系统全面的预测建模思维,提升学员的数据建模综合能力。

本系列课程从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,对数据预测建模的过程进行了全面的介绍(从模型选择,到属性选择,再到训练模型,评估模型以及优化模型),通过大量的操作演练,帮助学员掌握数据建模的思路、方法、技巧,以提升学员的数据建模的能力,支撑运营决策的目的。

通过本课程的学习,达到如下目的:
1、掌握数据建模的标准流程。
2、掌握时序预测建模的基本思想,理解因素分解的思路。
3、掌握常用的趋势拟合模型。
4、掌握常用的季节预测模型,能够进行季节周期性的时序建模。
5、深刻理念平稳序列的概念,以及平稳性检验。
6、掌握平稳序列的模型识别,以及模型定阶。
7、掌握时序预测模型的评估,以及优化。
8、掌握高级时序模型的训练与建模。
【授课时间】
2~4天时间
(要根据学员的实际情况调整重点内容及时间)
【授课对象】
数据分析部、IT开发部、业务支撑部、运营分析部等相关技术人员。
【学员要求】
1、每个学员自备一台便携机(必须)。
2、便携机中事先安装好Python 3.10版本及以上。
3、安装好Numpy,Pandas,statsmodels,sklearn,scipy,keras等扩展库。
注:讲师现场提供分析的代码和数据源。

【授课方式】
建模流程+ 案例演练 + 开发实践 + 可视化呈现
采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
第一部分:  预测建模基础
1、 数据建模六步法
Ø  选择模型:基于业务选择恰当的数据模型
Ø  属性筛选:选择对目标变量有显著影响的属性来建模
Ø  训练模型:采用合适的算法,寻找到最合适的模型参数
Ø  评估模型:进行评估模型的质量,判断模型是否可用
Ø  优化模型:如果评估结果不理想,则需要对模型进行优化
Ø  应用模型:如果评估结果满足要求,则可应用模型于业务场景
2、 数据挖掘常用的模型
Ø  数值预测模型:回归预测、时序预测等
Ø  分类预测模型:逻辑回归、决策树、神经网络、支持向量机等
Ø  市场细分:聚类、RFM、PCA等
Ø  产品推荐:关联分析、协同过滤等
Ø  产品优化:回归、随机效用等
Ø  产品定价:定价策略/最优定价等
3、 属性筛选/特征选择/变量降维
Ø  基于变量本身特征
Ø  基于相关性判断
Ø  因子合并(PCA等)
Ø  IV值筛选(评分卡使用)
Ø  基于信息增益判断(决策树使用)
4、 训练模型及实现算法
Ø  模型原理
Ø  算法实现
5、 评估模型
Ø  评估指标
Ø  评估方法
Ø  残差评估
6、 模型优化
Ø  优化模型:选择新模型/修改模型
Ø  优化数据:新增显著自变量
Ø  优化公式:采用新的计算公式
7、 模型应用
Ø  模型解读
Ø  模型保存/加载
Ø  模型应用/预测
8、 好模型是优化出来的

第二部分:  时序模型基础
问题:无法找到影响因素,无法回归建模,怎么办?随着业务受季节性因素影响,未来的销量如何预测?
1、回归预测vs时序预测
2、时序预测的原理及应用场景
3、常见时序预测模型
Ø  趋势类预测模型
Ø  季节类预测模型
Ø  平稳时序预测模型
Ø  其它高级模型
4、时序建模的基本思想:因素分解思想
5、时间序列的四个构成要素
Ø  长期趋势Trend
Ø  季节变动Seasonality
Ø  循环变动Circle
Ø  不规则变动Irregular
6、季节性的3种模式
Ø  确定的季节性
Ø  随机平稳的季节性
Ø  随机非平稳的季节性
7、季节性的检验
Ø  测量季节强度
Ø  检测非平稳季节性
Ø  相关性检验
Ø  自相关/偏相关分析
8、时间序列分解
案例:时间序列的季节分解

第三部分:  时序模型评估
1、 拟合程度指标
Ø     判定系数:
2、 误差评估指标
Ø  平均绝对误差:MAE
Ø  根均方差:RMSE
Ø  平均误差率:MAPE
3、 信息损失准则指标
Ø  赤池信息准则(Akaike Information Criterion,AIC)
Ø  贝叶斯信息准则(Bayesian Information Criterion,BIC)
Ø  HQIC(Hannan-QuinnInformation Criterion,HQIC)
4、 评估方法
Ø  滚动交叉验证法(cross validation)
5、 其它评估
Ø  残差评估:白噪声评估

第四部分:  趋势预测模型
问题:无法找到影响因素,无法回归建模,怎么办?随着业务受季节性因素影响,未来的销量如何预测?
1、移动平均
Ø  应用场景及原理
Ø  理解滑动窗口
Ø  移动平均种类
²  一次移动平均
²  二次移动平均
²  加权移动平均
²  移动平均比率法
Ø  移动平均关键问题
²  最佳期数N的选择原则
²  最优权重系数的选取原则
演练:销售额预测模型及评估
演练:快销产品季节销量预测及评估
2、指数平滑
Ø  应用场景及原理
Ø  最优平滑系数的选取原则
Ø  指数平滑种类
²  一次指数平滑
²  二次指数平滑(Brown线性)
²  三次指数平滑
演练:煤炭产量预测
3、Holt趋势模型(亦称二次指数平滑)
Ø  Holt线性模型
Ø  Holt指数模型
Ø  阻尼线性趋势
Ø  阻尼指数趋势
第五部分:  季节预测模型
1、因素分解法
Ø  移动平均差值法
Ø  移动平均比率法
2、Holt-Winters季节模型:HW加法、HW乘法、HW指数
Ø  适用场景
Ø  计算公式
Ø  超参优化
Ø  模型解读
案例:航空飞行里程预测模型
案例:汽车销量预测模型
案例:沃尔玛收益预测模型
3、基于回归的季节模型:相加模型、相乘模型
Ø  模型参数、模型解读
第六部分:  平稳序列模型
1、平稳序列预测模型简介
2、序列平稳性概念
Ø  恒定的均值
Ø  恒定的标准差
Ø  与位置无关的协方差
3、序列平稳性检验
Ø  折线图法
Ø  ACF/PACF图
Ø  ADF检测法
4、特殊平稳序列:白噪声
案例:序列平稳性检验
案例:白噪声检验
5、平稳序列常用拟合模型
Ø  AR(p)自回归模型
Ø  MA(q)移动平均模型
Ø  ARMA(p,q)自回归移动平均模型
6、模型识别
Ø  ACF图
Ø  PACF图
7、模型定阶
Ø  图形定阶(ACF/PACF)
Ø  最小信息准则定阶
8、非平稳序列处理
Ø  平滑法
Ø  变量变换
Ø  差分运算:k步差分与d阶差分
9、ARIMA(p,d,q)建模流程
案例:上海证券交易所收盘价建模
10、     SARIMA(p,d,q)(P,D,Q,S)模型
Ø  图形确定阶数
Ø  遍历确定阶数
11、     时序模型总结
第七部分:  机器学习时序模型
1、Prophet模型介绍
Ø  趋势拟合
Ø  季节性预测
Ø  节假日和特殊事件的影响
Ø  离群值分析
案例:销售额时序预测模型
2、NeuralProphet模型
3、GBDT集成模型
4、XGBoost模型
5、LightGBM模型
第八部分:  深度学习时序模型
1、LSTM模型简介
Ø  数据集构造
Ø  形状构造
Ø  滚动预测
案例:广告点击量时序建模
2、seq2seq框架
3、Transform模型
结束:课程总结与问题答疑。

傅一航老师的相关内容

使用道具

管理技能讲师|企业战略讲师|网络媒体讲师|营销服务讲师|职场技能讲师|人力资源讲师|党政爱国讲师|财税金融讲师|生产管理讲师|其他类讲师|内训课程|讲师列表|手机版|

讲师库 | 讲师列表 | 账号登录 | 立即注册 | 网站地图 | 京公网安备11010702002698 | 京ICP备2024062795号-1

返回顶部 返回列表