| Python数据分析与可视化实战培训 【课程目标】 本课程为基础课程,主要讲解如何利用Python进行数据分析,以及数据可视化。假定学员已经基本掌握Python语言的使用。 通过本课程的学习,达到如下目的: 1、掌握数据分析的基本步骤和过程(数据分析六步曲) 2、掌握搭建数据分析框架的基本思想(数据分析框架) 3、熟悉Pandas常用数据结构,掌握用Python访问、操作数据集 4、掌握Pandas常用的统计功能(函数和方法) 5、理解统计分析原理,掌握统计分析常用的分析方法 6、熟练掌握matplotlib模块,熟练画图函数 7、学会解读图形,形成业务结论和业务策略。 【授课时间】 2天时间 (要根据学员的实际情况调整重点内容及时间) 【授课对象】 业务支持部、IT系统部、系统开发部、网络运维部等相关技术人员。 【学员要求】 1、每个学员自备一台便携机(必须)。 2、便携机中事先安装好Python 3.9版本及以上。 注:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。   【授课方式】 分析步骤 + 分析框架+ 分析方法 + 可视化呈现 + 案例实战 采用互动式教学,围绕业务问题,展开数据分析过程,全过程演练操作,让学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。 【课程大纲】第一部分:  数据分析基础 目的:掌握数据分析基本步骤和过程,学会如何构造数据分析框架 1、数据分析 VS 数据挖掘 2、数据分析的六步曲 Ø  步骤1:明确目的--理清思路 Ø  步骤2:数据收集—理清思路 Ø  步骤3:数据预处理—寻找答案 Ø  步骤4:数据分析--寻找答案 Ø  步骤5:数据展示--观点表达 Ø  步骤6:报表撰写--观点表达 3、搭建精准营销分析框架 演练:如何用大数据来支撑手机精准营销项目第二部分: 数据操作基础 1、简化的Python操作过程 2、常用扩展包 Ø  Numpy数组处理支持 Ø  Pandas数据分析和探索工具 Ø  Matplotlib可视化工具库 3、数据集读写 Ø  读取文件(CSV文件、Excel文件) Ø  数据集保存(CSV、Excel) 4、数据集结构 Ø  数据集基本属性 Ø  Index:位置索引、标签索引 Ø  Series:一维结构 Ø  DataFrame:二维结构 5、数据集基本操作 Ø  数据访问:行访问/列访问/值访问 Ø  字段类型 ²  类型检查 ²  类型转换 ²  定义有序类别变量 Ø  排序 ²  按值排序 ²  按索引排序 Ø  数据筛选 Ø  数据修改 Ø  数据删除第三部分:  统计分析方法篇 1、统计分析基础 Ø  统计分析的关键要素 Ø  统计分析三个步骤 2、六种统计操作 Ø  描述统计describe Ø  分类计数value_counts Ø  分段计数/分箱计数value_counts(bins) Ø  分类汇总(groupby, count/sum/mean/…) Ø  透视表(多维统计分析)pivot_table Ø  按日期汇总resample/to_period 案例实战:掌握常用的Python统计函数/方法 3、五种统计分析方法 Ø  对比分析法(不同用户的消费水平差异) Ø  结构分析法(用户的学历结构、收入结构分析、动态结构分析) Ø  分布分析法(用户的年龄分布、用户消费层次) Ø  交叉分析法(产品偏好分析) Ø  趋势分析法(销售淡旺季节、用户活跃时间) 案例实战:掌握常用的统计分析方法第四部分:  数据可视化 目的:掌握作图扩展库,实现数据可视化 1、中文显示的问题解决 2、绘图对象:画布fig与坐标系Ax 3、了解图形元素及其函数 Ø  标题、坐标轴、刻度 Ø  数据标签、文本、注释 Ø  图例、网格线、边框 4、简单图形的画法 Ø  柱状图(简单/复式/堆积/堆积百分比柱状图) Ø  直方图(分布分析,查看分布特征) Ø  箱线图(判断离群值) Ø  饼图(结构分析) Ø  折线图(趋势分析) 5、绘图高级功能 Ø  图形颜色样式 Ø  坐标轴优化 Ø  主刻度与次刻度 Ø  多坐标系 Ø  子图布局(边界与空隙) Ø  共享坐标轴 6、图形保存第五部分:  数据预处理 1、数据预处理四大任务 2、数据集成 Ø  数据追回 Ø  变量合并 Ø  拼接 演练:样本追加与变量合并 3、数据清洗 Ø  四大异常数据 Ø  重复值检查与处理 Ø  无效值检查与处理 Ø  离群值检查与处理 Ø  缺失值检查与处理 演练:异常值查找、删除、填充 4、样本处理 5、变量处理第六部分:  实战篇(上述知识点都融入下面分析实战中) 1、零售商用户消费行为分析 Ø  用户行为分析框架:5W2H Ø  用户的典型特征 Ø  用户的消费能力 Ø  用户的消费水平 2、运营商用户购买行为分析 Ø  用户维度 ²  用户地域分布 ²  用户学历结构 ²  用户消费能力/消费层次 ²  用户流量分布/层次 ²  用户流失分析 Ø  产品维度 ²  套餐销量分析 ²  套餐贡献分析 ²  服务满意度分析 ²  套餐偏好分析 Ø  时间维度 ²  产品淡旺季分析 ²  用户活跃度分析 ²  重购周期分析 Ø  金额维度 ²  收入结构(用户、产品、区域) ²  价格偏好分析 ²  成本/利润分析 3、金融风险数据分析 Ø  用户维度 ²  违约用户的典型特征 ²  违约用户的消费水平 Ø  违约的影响因素分析 ²  违约与学历/岗位的关系 ²  违约与行业/职业的关系 注:会根据学员所在行业选择合适的实战案例。   结束:课程总结与问题答疑。 
 |