课程名称 q 课程介绍
本课程是大数据与使用sas做数据挖掘的基础课。 主要内容是: 1、介绍了大数据的定义。回顾大数据的时代背景、大数据的构成,已经大数据的“4v”特征。并且介绍了大数据的技术与应用范围。并介绍了大数据已经对我们产生的影响。以及一个广受欢迎的大数据支撑产品---hadoop软件的安装 2、大数据是数据分析的前提,也是从数据中产生价值的基础。真正产生价值,我们还要通过数据分析----SAS数据挖掘简介、从外部数据源加载数据到SAS数据集、简单的数据分析,三部分。 q 适合对象
课程适合想要从事大数据、数据分析、数据挖掘工作的初级人员 q 课程目标
l 理解大数据的定义 l 了解大数据技术 l 明白大数据对我们的影响 l Hadoop安装 l 课程需完成的目标读取原始数据文件和SAS数据集 l 调查和生成频率表和描述性统计汇总数据 l 创建的SAS变量和重新编码的数据值 l 数据子集 l 结合多个SAS文件 l 创建列表,汇总,HTML和图形报表。 l 读取SAS数据集 l 读取原始数据文件 l 通过级联和合并相结合的SAS数据集 l 通过赋值语句和条件逻辑创建的SAS变量 q 课程大纲
第一章. 大数据的定义 1.1. 大数据的时代背景 1.2. 大数据的”4V”特征 1.3. 大数据的构成 第二章. 大数据的技术与应用 2.1. 大数据要解决的问题 2.2. 大数据的相关技术 2.3. 大数据的应用实例 第三章. 机遇与挑战 3.1. 这是一场生活、工作与思维的变革。 3.2. 精准营销 3.3. 业务拓展 3.4. 客户服务 3.5. 风险控制 3.6. 商业模式 第四章. Hadoop 软件安装 4.1. 安装准备 4.2. 安装过程 4.3. 需要注意的问题 第五章. SAS简介 5.1. 在SAS系统概述 第六章. 开始与SAS系统 6.1. 介绍SAS程序 6.2. 运行SAS程序 6.3. 掌握基本概念 6.4. 诊断和纠正语法错误 6.5. 探索您的SAS环境 第七章. 快速熟悉SAS数据集 7.1. SAS数据库 7.2. 解决方案习题 第八章. 生产报告表 8.1. 入门与打印程序 8.2. 排序和分组观察 8.3. 识别观察 8.4. 特殊WHERE语句运算符 第九章. 加强输出 9.1. 自定义报表外观 9.2. 格式化数据值 9.3. 创建的HTML报告 第十章. 创建的SAS数据集 10.1.读取原始数据文件:输入栏 10.2.读取原始数据文件:格式化输入 10.3.检查数据错误 10.4.指定变量属性 10.5.更改变量属性 10.6.读取Excel电子表格 第十一章. 数据步编程 11.1.读SAS数据集和创建变量 11.2.条件处理 11.3.删除和保存变量 第十二章. 混合使用SAS数据集 12.1.串连SAS数据集 12.2.合并SAS数据集 8.3结合使用SAS数据集:附加功能 第十三章. 制作摘要报告 13.1.介绍报告摘要 13.2.基本总结报告 13.3.报告程序 13.4.TABULATE程序 第十四章. 介绍图形 14.1.生产条形图和饼图 14.2.提高输出 14.3.制作图解 第十五章. 数据描述统计分析之PROC MEANS 15.1.PROC MEANS语法 15.2.相关值的含义 15.3.案例 第十六章. 数据描述统计分析之PROC GPLOT 16.1.PROC GPLOT语法 16.2.案例 第十七章. 数据挖掘之线性回归 PROC REG 17.1.PROC REG语法 17.2.案例 17.3.模型选择 17.4.模型预测
|