Python数据分析与可视化实战培训 【课程目标】 本课程为基础课程,主要讲解如何利用Python进行数据分析,以及数据可视化。假定学员已经基本掌握Python语言的使用。 通过本课程的学习,达到如下目的: 1、掌握数据分析的基本步骤和过程(数据分析六步曲) 2、掌握搭建数据分析框架的基本思想(数据分析框架) 3、熟悉Pandas常用数据结构,掌握用Python访问、操作数据集 4、掌握Pandas常用的统计功能(函数和方法) 5、理解统计分析原理,掌握统计分析常用的分析方法 6、熟练掌握matplotlib模块,熟练画图函数 7、学会解读图形,形成业务结论和业务策略。 【授课时间】 2天时间 (要根据学员的实际情况调整重点内容及时间) 【授课对象】 业务支持部、IT系统部、系统开发部、网络运维部等相关技术人员。 【学员要求】 1、每个学员自备一台便携机(必须)。 2、便携机中事先安装好Python 3.9版本及以上。 注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。 【授课方式】 分析步骤 + 分析框架+ 分析方法 + 可视化呈现 + 案例实战 采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。 【课程大纲】 第一部分: 数据分析基础目的:掌握数据分析基本步骤和过程,学会如何构造数据分析框架 1、数据分析 VS 数据挖掘 2、数据分析的六步曲 Ø 步骤1:明确目的--理清思路 Ø 步骤2:数据收集—理清思路 Ø 步骤3:数据预处理—寻找答案 Ø 步骤4:数据分析--寻找答案 Ø 步骤5:数据展示--观点表达 Ø 步骤6:报表撰写--观点表达 3、搭建精准营销分析框架 演练:如何用大数据来支撑手机精准营销项目 第二部分: 数据操作基础1、简化的Python操作过程 2、常用扩展包 Ø Numpy数组处理支持 Ø Pandas数据分析和探索工具 Ø Matplotlib可视化工具库 3、数据集读写 Ø 读取文件(CSV文件、Excel文件) Ø 数据集保存(CSV、Excel) 4、数据集结构 Ø 数据集基本属性 Ø Index:位置索引、标签索引 Ø Series:一维结构 Ø DataFrame:二维结构 5、数据集基本操作 Ø 数据访问:行访问/列访问/值访问 Ø 字段类型 ² 类型检查 ² 类型转换 ² 定义有序类别变量 Ø 排序 ² 按值排序 ² 按索引排序 Ø 数据筛选 Ø 数据修改 Ø 数据删除 第三部分: 统计分析方法篇1、统计分析基础 Ø 统计分析的关键要素 Ø 统计分析三个步骤 2、六种统计操作 Ø 描述统计describe Ø 分类计数value_counts Ø 分段计数/分箱计数value_counts(bins) Ø 分类汇总(groupby, count/sum/mean/…) Ø 透视表(多维统计分析)pivot_table Ø 按日期汇总resample/to_period 案例实战:掌握常用的Python统计函数/方法 3、五种统计分析方法 Ø 对比分析法(不同用户的消费水平差异) Ø 结构分析法(用户的学历结构、收入结构分析、动态结构分析) Ø 分布分析法(用户的年龄分布、用户消费层次) Ø 交叉分析法(产品偏好分析) Ø 趋势分析法(销售淡旺季节、用户活跃时间) 案例实战:掌握常用的统计分析方法 第四部分: 数据可视化目的:掌握作图扩展库,实现数据可视化 1、中文显示的问题解决 2、绘图对象:画布fig与坐标系Ax 3、了解图形元素及其函数 Ø 标题、坐标轴、刻度 Ø 数据标签、文本、注释 Ø 图例、网格线、边框 4、简单图形的画法 Ø 柱状图(简单/复式/堆积/堆积百分比柱状图) Ø 直方图(分布分析,查看分布特征) Ø 箱线图(判断离群值) Ø 饼图(结构分析) Ø 折线图(趋势分析) 5、绘图高级功能 Ø 图形颜色样式 Ø 坐标轴优化 Ø 主刻度与次刻度 Ø 多坐标系 Ø 子图布局(边界与空隙) Ø 共享坐标轴 6、图形保存 第五部分: 数据预处理1、数据预处理四大任务 2、数据集成 Ø 数据追回 Ø 变量合并 Ø 拼接 演练:样本追加与变量合并 3、数据清洗 Ø 四大异常数据 Ø 重复值检查与处理 Ø 无效值检查与处理 Ø 离群值检查与处理 Ø 缺失值检查与处理 演练:异常值查找、删除、填充 4、样本处理 5、变量处理 第六部分: 实战篇(上述知识点都融入下面分析实战中)1、零售商用户消费行为分析 Ø 用户行为分析框架:5W2H Ø 用户的典型特征 Ø 用户的消费能力 Ø 用户的消费水平 2、运营商用户购买行为分析 Ø 用户维度 ² 用户地域分布 ² 用户学历结构 ² 用户消费能力/消费层次 ² 用户流量分布/层次 ² 用户流失分析 Ø 产品维度 ² 套餐销量分析 ² 套餐贡献分析 ² 服务满意度分析 ² 套餐偏好分析 Ø 时间维度 ² 产品淡旺季分析 ² 用户活跃度分析 ² 重购周期分析 Ø 金额维度 ² 收入结构(用户、产品、区域) ² 价格偏好分析 ² 成本/利润分析 3、金融风险数据分析 Ø 用户维度 ² 违约用户的典型特征 ² 违约用户的消费水平 Ø 违约的影响因素分析 ² 违约与学历/岗位的关系 ² 违约与行业/职业的关系 注:会根据学员所在行业选择合适的实战案例。 结束:课程总结与问题答疑。
|