誉天新版HCIE-Big Data认证课程大纲,欢迎围观
0 ]$ P/ F2 @. v R! `! A1 w* t8 j& q+ Y, Z9 y, k' l
大数据是当下 IT 领域最热门,最高大上,也是最被看好的行业,人才的稀缺程度从各公司,各大招聘网站开出的薪水便能感知,高薪就业无忧, 但大数据对于很多人来说不知道该如何学习,需要哪些基础,学习一些什么内容,誉天将为零基础学员量身定做,成为一名合格的大数据工程师,我们专注实战和就业。 华为大数据认证可胜任的岗位: 大数据挖掘专家/工程师,高级行业分析师,大数据业务架构师/工程师, 大数据架构师/工程师,大数据算法工程师,大数据开发工程师,大数据运维工程师 预备知识 00001. 了解大数据技术原理和 Hadoop 的基础知识 00002. 熟悉 Linux 的管理和操作 00003. 具有数据库的基本知识,有数据库的使用经验,了解 SQL 语言。 00004. 具备一定软件开发能力,熟悉 Java、Python, C++等至少一种开发语言。 00005. 数学知识 00006. Linux 系统安装 00007. Linux 基础使用 00008. Linux 帮助系统和文件系统管理 00009. 用户,组及权限管理 00010. IO 及管道,循环语句,环境变量,shell 基础,脚本基础(精华) 00011. 文本处理工具,grep,awk,sed 正则表达式等(精华) 00012. 进程管理,远程管理工具 00013. Linux 下文件查找与压缩 00014. Linux 下文件系统的深入理解(精华) 00015. Linux 下软件包的安装和管理 00016. Shell 脚本实战(精华) 00001. 搭建实验环境、 虚拟机/操作系统/数据库安装/数据库应用安装、数据库基础知识 00002. SELECT 基本语法、过滤和排序数据、单行函数、高级子查询 (精华) 00003. 多表查询、分组函数、子查询、操纵数据、使用集合运算 (精华) 00004. 创建和管理表、内置约束、创建视图、索引及其他数据库对象 (精华) 00005. 控制用户访问,数据字典 课程内容7 ?1 H7 Q6 j- j% N
Linux 模块一 (18 小时)
4 ~( K1 H* n: N& A将利用我们多年的 Linux 经验,让您从零基础迅速掌握 Linux 基本技能,满足后续搭建原生态的 Hadoop 和学习 python 做好准备,这个基础非常重要 数据库模块二(12 小时)
+ x% G9 z2 v( U0 _' E) s1 b" v这个是学习分布式数据库的基础,为后续分析平台做好准备,学习数据库的安装,SQL 语句,数据库的基本操作,数据库视图,索引等。
& l8 }, h; s% h6 ] q+ Gpython 开发模块三 (36 小时)精华内容, r$ s( y7 a: z# i* E3 C
Python 是目前世界上最流行的开发语言,也是云计算、大数据、人工智能时代最好的开发语言,也是最容易上手的开发语言,没有开发,就没有大数据,誉天将零基础带你进入 python 的大门,学习 Hadoop 模块二次开发,就业无忧。 2018 年,浙江省信息技术教材将不会在使用晦涩难懂的 VB 语言,而是改学更简单易懂的 Python 语言。也就是说,Python 语言将纳入高考内容之一。Python 语言将纳入高考内容之一,编程语言在升学中的比重逐渐加大,将要成为高考加分的一大利器,从国家层面开始推行 Python,可见对于大数据和人工智能时代的重要性 安装 Python,Python 解释器 第一个 Python 程序 使用文本编辑器,输入和输出 Python 基础,基础语法 变量类型,运算符 条件语句,循环语句,While 循环语句 for 循环语句,循环嵌套,break 语句 continue 语句,pass 语句 Number(数字),字符串,列表(List),元组 字典(Dictionary),日期和时间 函数,模块,文件 I/O,File 方法,异常处理 内置函数,高级特性,切片,迭代,列表生成式 生成器,函数式编程,高阶函数,map/reduce,filter,sorted 返回函数,匿名函数,装饰器,偏函数,模块 使用模块,安装第三方模块 面向对象编程,类和实例,访问限制,继承和多态,获取对象信息 面向对象高级编程 Hadoop 模块开发实战 Hadoop 技术模块四 (24 小时)
4 @4 x5 }0 o# d& a! MHadoop 是大数据最重要的运行平台,华为 FusionInsight HD 就是基于开源的
8 e# {( {- i! f# N# G( [( LHadoop 开发,但 Hadoop 组件众多,原理复杂,我们将从原理及流程开始讲解每个组件,然后使用命令行搭建一套开源的 Hadoop 系统,这样才能更透彻的理解这些组件,最好搭建出华为 FusionInsight 进行商业化应用 Hadoop 基础 MapReduce 和 YARN 分布式计算引擎技术 LDAP 及 Kerberos 工作原理及应用 Hadoop 分布式文件系统 Spark 基于内存的分布式计算技术 Hive 数据仓库 HBase 分布式数据库 Zookeeper 集群分布式锁设施 Streaming 实时计算技术及应用 Kafka 订阅消息系统 Flume 海量日志聚合 华为 FusionInsight 模块五 (18 小时) 1. 数据仓库平台 FusionInsight LibrA 第一章 分布式数据库架构 第二章 FusionInsight LibrA 基本组件简介 第三章 FusionInsight LibrA 产品特性和关键技术 第四章 FusionInsight LibrA 配套工具集 第五章 FusionInsight LibrA 安全管理 第六章 FusionInsight LibrA 数据库管理系统并发控制 第七章 FusionInsight LibrA 数据库性能监控 第八章 FusionInsight LibrA 数据迁移第九章 FusionInsight LibrA SQL 介绍 第十章 FusionInsight LibrA 数据库设计 第十一章 FusionInsight LibrA 应用程序开发指导 2.FusionInsight LibrA 实验 FusionInsight LibrA 基本操作、语法FusionInsight LibrA 性能优化 网络 KPI 数据栅格化处理重点区域数据分析 流动人口常驻地分析 大数据挖掘技术与实现 模块六 (30 小时)! P1 t) s% X( b1 B2 f$ i
数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD), 是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。 第十二章 预备知识和数据介绍第十三章 数据预处理 第十四章 数据仓库介绍 第十五章 分类 (Classification) 第十六章 聚类 (Clustering) 第十七章 离群点检测 第十八章 关联规则(Association Rule) 第十九章 FusionInsight Miner 和华为云机器学习服务 MLS 大数据挖掘项目实战 (12 小时)) y) P: _ Y3 a) Z( v
银行定期存款业务预测客户分群1 ~5 h9 c+ m4 V& H" D8 w
CRM 用户精准营销 / T4 ~( B$ L6 n9 y5 j7 g' @
【学院名称】:誉天教育 【咨询QQ】:1746063655(微信同号) 【关注誉天公众号】:yutianedu2015 【学校地址】: 杭州市西湖区文三路553号浙江中小企业大厦2108室(杭州校区) 武汉市珞瑜路766号光谷世界城广场1号写字楼22层(武汉校区) 广东省广州市天河区林和西路167号威尼国际1712室(广州校区) 北京市海淀区苏州街18号长远天地大厦B2座610室(北京校区) 湖南省长沙市芙蓉区五一大道158号潇湘国际大厦1726室(长沙校区) - }- @5 u1 W- v1 L/ M
, ^. X9 R4 h1 I, r
|