让天下没有难找的讲师,职业讲师,商业讲师,培训师,讲师库-北京昭智教育

傅一航:Python数据分析与可视化实战培训

[复制链接]
Python数据分析与可视化实战培训
【课程目标】
本课程为基础课程,主要讲解如何利用Python进行数据分析,以及数据可视化。假定学员已经基本掌握Python语言的使用。
通过本课程的学习,达到如下目的:
1、掌握数据分析的基本步骤和过程(数据分析六步曲)
2、掌握搭建数据分析框架的基本思想(数据分析框架)
3、熟悉Pandas常用数据结构,掌握用Python访问、操作数据集
4、掌握Pandas常用的统计功能(函数和方法)
5、理解统计分析原理,掌握统计分析常用的分析方法
6、熟练掌握matplotlib模块,熟练画图函数
7、学会解读图形,形成业务结论和业务策略。
【授课时间】
2-3天时间
(要根据学员的实际情况调整重点内容及时间)
【授课对象】
业务支持部、IT系统部、系统开发部、网络运维部等相关技术人员。
【学员要求】
1、每个学员自备一台便携机(必须)。
2、便携机中事先安装好Python 3.10版本及以上。
注:讲师提供现场分析的数据源。
【授课方式】
分析步骤 + 分析框架+ 分析方法 + 可视化呈现 + 案例实战
采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
第一部分:  数据分析流程步骤
目的:掌握数据分析基本步骤和过程,学会如何构造数据分析框架
1、数据分析 VS 数据挖掘
2、数据分析的六步曲
Ø  步骤1:明确目的--理清思路
Ø  步骤2:数据收集—理清思路
Ø  步骤3:数据预处理—寻找答案
Ø  步骤4:数据分析--寻找答案
Ø  步骤5:数据展示--观点表达
Ø  步骤6:报表撰写--观点表达
3、搭建数据分析框架
演练:银行用户消费习惯/购买行为分析的框架与内容
第二部分: 数据操作基础
1、简化的Python操作过程
2、常用扩展包
Ø  Numpy数组处理支持
Ø  Pandas数据分析和探索工具
Ø  Matplotlib可视化工具库
3、数据集读写
Ø  读取文件(CSV文件、Excel文件)
Ø  数据集保存(CSV、Excel)
4、数据集结构
Ø  数据集基本属性
Ø  Index:位置索引、标签索引
Ø  Series:一维结构
Ø  DataFrame:二维结构
5、数据集基本操作
Ø  数据访问:行访问/列访问/值访问
Ø  字段类型
²  类型检查
²  类型转换
²  定义有序类别变量
Ø  排序
²  按值排序
²  按索引排序
Ø  数据筛选
Ø  数据修改
Ø  数据删除
第三部分:  统计分析方法篇
1、统计分析基础
Ø  统计分析的关键要素
Ø  统计分析三个步骤
2、六种统计操作
Ø  描述统计describe
Ø  分类计数value_counts
Ø  分段计数/分箱计数value_counts(bins)
Ø  分类汇总(groupby, count/sum/mean/…)
Ø  透视表(多维统计分析)pivot_table
Ø  按日期汇总resample/to_period
案例实战:掌握常用的Python统计函数/方法
3、五种统计分析方法
Ø  对比分析法(用户的消费水平差异)
Ø  结构分析法(用户的学历结构、收入结构分析)
Ø  分布分析法(用户的年龄/收入分布、用户消费层次)
Ø  交叉分析法(产品偏好分析、用户违约的影响因素分析)
Ø  趋势分析法(时间因素影响及季节周期性分析)
案例实战:掌握常用的统计分析方法
第四部分:  数据可视化
目的:掌握作图扩展库,实现数据可视化
1、中文显示的问题解决
2、绘图对象:画布fig与坐标系Ax
3、了解图形元素及其函数
Ø  标题、坐标轴、刻度
Ø  数据标签、文本、注释
Ø  图例、网格线、边框
4、简单图形的画法
Ø  柱状图(简单/复式/堆积/堆积百分比柱状图)
Ø  饼图(结构分析)
Ø  直方图(分布分析,查看分布特征)
Ø  箱线图(判断离群值)
Ø  折线图(趋势分析)
Ø  散点图(相关分析)
Ø  雷达图/极坐标
5、绘图高级功能
Ø  图形颜色样式
Ø  坐标轴优化
Ø  主刻度与次刻度
Ø  多坐标系
Ø  子图布局(边界与空隙)
Ø  共享坐标轴
6、图形文件保存
第五部分:  数据预处理
1、数据预处理四大任务
2、数据集成
Ø  样本追加
Ø  变量合并
Ø  函数concat,merge
演练:样本追加与变量合并
3、数据清洗
Ø  四大异常数据
Ø  重复值检查与处理
Ø  无效值检查与处理
Ø  离群值检查与处理
Ø  缺失值检查与处理
演练:异常值查找、删除、填充
4、样本处理
Ø  筛选
Ø  抽样(个数与百分比)
5、变量处理
第六部分:  实战篇(上述知识点都融入下面分析实战中)
1、银行用户消费行为分析
Ø  用户行为分析框架:5W2H
Ø  用户的典型特征
Ø  用户的消费水平/消费层次
2、金融风险数据分析
Ø  用户维度
²  违约用户的典型特征
²  违约用户的消费水平
Ø  违约的影响因素分析
²  违约与学历/岗位的关系
²  违约与行业/职业的关系
注:会根据学员所在行业选择合适的实战案例。
结束:课程总结与问题答疑。

傅一航老师的相关内容

使用道具

管理技能讲师|企业战略讲师|网络媒体讲师|营销服务讲师|职场技能讲师|人力资源讲师|党政爱国讲师|财税金融讲师|生产管理讲师|其他类讲师|内训课程|讲师列表|手机版|

讲师库 | 讲师列表 | 账号登录 | 立即注册 | 网站地图 | 京公网安备11010702002698 | 京ICP备2024062795号-1

返回顶部 返回列表