太原大数据spark内存计算培训班

导读 我们尚学堂大数据课程主要针对那些想要学大数据的学员,尚学堂*部协助学员*,跟很多企业达成了上门招聘合作,,逐步带大家**含Mapreduce、Hbase、Hive、Sqoop、Flume、Zookeeper等在内的前沿实战技术,不仅如此,尚学堂紧密关注大数据前沿领域,并对课程内容实时更新,确保课程内容更新、更快!
400-882-1633 31
JAVA开发技术培训 大数据云计算培训 人工智能python培训

课程详情

2018-09-05

大数据

我们尚学堂大数据课程主要针对那些想要学大数据的学员,尚学堂*部协助学员*,跟很多企业达成了上门招聘合作,,逐步带大家**含Mapreduce、Hbase、Hive、Sqoop、Flume、Zookeeper等在内的前沿实战技术,不仅如此,尚学堂紧密关注大数据前沿领域,并对课程内容实时更新,确保课程内容更新、更快!

课程内容:
阶段 技术内容
Scala课程 在此部分内,将更注重scala的各种语言规则与简单直接的应用,而不在于其是如何具体实现,通过学习本课程能具备初步的Scala语言实际编程能力。本部分课程也可以视为大家下面学习Spark课程的铺垫,供大家扫盲熟悉Scala,提前进行热身运动。
1) scala解释器、变量、常用数据类型等
2) scala的条件表达式、输入输出、循环等控制结构
3) scala的函数、默认参数、变长参数等
4) scala的数组、变长数组、多维数组等
5) scala的映射、元组等操作
6) scala的类,*括bean属性、辅助构造器、主构造器等
7) scala的对象、单例对象、伴生对象、扩展类、apply方法等
8) scala的*、引入、继承等概念
9) scala的特质
10) scala的操作符
11) scala的高阶函数
12) scala的集合
13) scala数据库连接
Spark
大数据处理
本部分内容全面涵盖了Spark生态系统的概述及其编程模型,深入内核的研究,Spark on Yarn,Spark Streaming流式计算原理与实践,Spark SQL,Spark的多语言编程以及SparkR的原理和运行。不仅面向项目开发人员,甚至对于研究Spark的学员,此部分都是非常有学习指引意义的课程。
1) Spark介绍
2) Spark应用场景
3) Spark和Hadoop MR、Storm的比较和优势
4) RDD
5) Transformation
6) Action
7) Spark计算PageRank
8) Lineage
9) Spark模型简介
10) Spark缓存策略和容错处理
11) 宽依赖与窄依赖
12) Spark配置讲解
13) Spark集群搭建
14) 集群搭建常见问题解决
15) Spark原理核心组件和常用RDD
16) 数据本地性
17) 任务调度
18) DAGScheduler
19) TaskScheduler
20) Spark源码解读
21) 性能调优
22) Spark和Hadoop2.x整合:Spark on Yarn原理
Spark Streaming
实时计算
1) Spark Streaming:数据源和DStream
2) 无状态transformation与有状态transformation
3) Streaming Window的操作
4) sparksql 编程实战
5) spark的多语言操作
6) spark最新版本的新特性
上一篇: 太原大数据storm流式计算培训班 下一篇: 太原大数据云计算培训班

推荐课程

查看全部课程
太原尚学堂培训学校

太原尚学堂培训学校

网络在线

查看全部校区 进入官方主页