先注册再绑定QQ
超级版主
大量的半结构化和非结构化信息无法管理和存储,大数据增长速度惊人,每年以几何级数速度增长,需要有专业化的解决方案应对大数据挑战。EMC收购了Greenplum之后,推出的针对Hadoop的Greenplum的数据库软件。 采用Greenplum HD技术管理半结构化和非结构化信息,整体TCO更低,除了进行有效存储和管理,可以通过MapReduce技术进行并行的分析和挖掘,把大量的数据存储变成有价值的数据资产。本课程深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、Chukwa等实战运用。另外还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在各个互联网巨头商业环境的运用。 一、 Hadoop的起源和体系 Hadoop思想起源:Google Hadoop子项目家族 Hadoop的架构 二、 Hadoop的安装与配置 准备和配置环境 三种运行模式 完全分布式模式安装 三、 HDFS-大数据存储 HDFS概念与体系结构 HDFS的可靠性 HDFS文件操作 HDFS API 四、 关于MapReduce MapReduce编程模型 MapReduce的集群行为 MapReduce任务的优化 MapReduce工作机制 错误处理及作业调度机制 五、 MapReduce应用开发 Hadoop Eclipse插件开发 数据筛选程序开发 倒排索引程序开发 六、 Hadoop监控与管理 页面监控 hadoop备份 七、 HBase数据库 Hbase体系结构 HBase shell HBase API应用实例 HBase场景应用 HBase模式设计 八、 Hive数据仓库 Hive组件与体系架构 Hive安装配置 Hive的服务接口 HiveQL常用操作 Hive的优化 Hive UDF编程 Hive综合实战 九、 Pig数据分析平台 Pig框架 Pig安装配置 Pig的使用 Pig的数据模型 常用Pig Latin操作 Pig UDF编程 Pig数据分析实战 十、ZooKeeper分布式服务框架 ZooKeeper工作原理 ooKeeper设计目标 ZooKeeper的数据结构和组成 ZooKeeper的安装配置 ZooKeeper命令行工具 ZooKeeper API ZooKeeper实战:Hadoop任务调度 十一、 Chukwa集群监控系统 Chukwa的组成 Chukwa架构和设计 Chukwa安装与配置 常用Chukwa命令 实现自定义数据处理 十二、 Hadoop商业应用案例 云计算概念和特征 云计算服务模式和形态 Hadoop在云计算的运用 京东商城 百度 阿里巴巴 腾讯 十三、 Greenplum Hadoop集群 集成架构的特征 集成架构的优势 配置gphdfs协议使用环境 使用HDFS外部表
使用道具 举报
初级工程师
资深技术经理
资深技术总监
优秀技术总监
优秀技术经理
助理工程师
中级工程师
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
|Archiver|手机版|小黑屋|sitemap|鸿鹄论坛 ( 京ICP备14027439号 )
GMT+8, 2025-3-12 09:40 , Processed in 0.072247 second(s), 24 queries , Redis On.
Powered by Discuz!
© 2001-2025 HH010.COM