让天下没有难找的讲师,职业讲师,商业讲师,培训师,讲师库-北京昭智教育

孙增辉:大数据处理技术培训

[复制链接]
1)      大数据处理技术培训
课程介绍
Hadoop实现了一个分布式文件系统(HadoopDistributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。   
课程目标
l  掌握大数据方法体系
l  掌握Hadoop原理技术
l  熟悉各项大数据处理手段和工具的使用。
培训对象
全省互联网分析人员
课程长度
5天
课程内容
  
第1天
  
主题
Hadoop入门,了解什么是hadoop
大纲
1Hadoop产生背景
  
2Hadoop在大数据、云计算中的位置和关系
  
3、国内外Hadoop应用案例介绍
  
4、国内Hadoop的课程大纲介绍
  
5Hadoop生态圈以及各组成部分的简介
  
6Hadoop核心MapReduce
  
例子说明
主题
分布式文件系统HDFS
大纲
1、分布式文件系统DFS简介
  
2HDFS的系统组成介绍
  
3HDFS的组成部分详解
  
4、副本存放策略及路由规则
  
5、命令行接口
  
6Java接口
  
7、客户端与HDFS的数据流讲解
  
8HDFS的可用性(HA
2
主题
初级MapReduce
大纲
1、如何理解mapreduce计算模型
  
2、剖析伪分布式下MapReduce作业的执行过程
  
3、序列化
  
4MapReduce的类型与格式
  
5MapReduce开发环境搭建
  
6MapReduce应用开发
  
7、更多示例讲解,熟悉MapReduce算法原理
主题
高级MapReduce
大纲
1、使用压缩分隔减少输入规模
  
2、利用Combiner减少中间数据
  
3、编写Partitioner优化负载均衡
  
4MapReduce优化
  
5、编程实战
3
主题
Hadoop集群与管理
大纲
1Hadoop集群的搭建
  
2Hadoop集群的监控
  
3Hadoop集群的管理
  
4、集群下运行MapReduce程序
主题
HBase基础知识
大纲
1HBase定义
  
2HBaseRDBMS的对比
  
3、数据模型
  
4、系统架构
  
5HBase上的MapReduce
  
6、表的设计
4
主题
HBase集群及其管理
大纲
1、集群的搭建过程讲解
  
2、集群的监控
  
3、集群的管理
主题
Zookeeper
大纲
1zookeeper的功能
  
2zookeeper集群搭建
  
3、查看zookeeper中数据的存储
                                 5
主题
Hive
大纲
1、数据仓库基础知识
  
2Hive定义
  
3Hive体系结构简介
  
4Hive集群
  
5、客户端简介
主题
HiveQL
大纲
1HiveQL定义
  
2HiveQLSQL的比较
  
3、数据类型
  
4、表与表分区概念
  
5、表的操作与CLI客户端演示
  
6、数据导入与CLI客户端演示
  
7、查询数据与CLI客户端演示
  
8、数据的连接与CLI客户端演示
  
9、用户自定义函数(UDF)的开发与演示  

使用道具

管理技能讲师|企业战略讲师|网络媒体讲师|营销服务讲师|职场技能讲师|人力资源讲师|党政爱国讲师|财税金融讲师|生产管理讲师|其他类讲师|内训课程|讲师列表|手机版|

讲师库 | 讲师列表 | 账号登录 | 立即注册 | 网站地图 | 京公网安备11010702002698 | 京ICP备2024062795号-1

返回顶部 返回列表