大数据Cloudera--Spark及Hadoop开发员培训课程

导读 腾科的Cloudera--Spark及Hadoop开发员培训课程主要适合具有编程经验的开发员及工程师,有一定相关的基础,希望能进一步提升自己的学员等,学员通过在腾科的专业、系统培训,快速通过认证考试,具备相关技能以及相关的从业资格!
400-688-0112 337
软件开发 华为认证 思科认证 甲骨文认证 红帽认证 微软认证 Cloudera(Hadoop) 其他课程

课程详情

2018-07-24

ClouderaSpark及Hadoop开发员培训课程

腾科的大数据Cloudera--Spark及Hadoop开发员培训课程主要适合具有编程经验的开发员及工程师,有一定相关的基础,希望能进一步提升自己的学员等,学员通过在腾科的专业、系统培训,快速通过认证考试,具备相关技能以及相关的从业资格!

一、课程大纲

   1. Hadoop及生态系统介绍
   2. ApacheHadoop文件存储
   3. ApacheHadoop集群上的数据处理
   4. 使用ApacheSqoop导入关系数据
   5. ApacheSpark基础
   6. SparkRDD
   7. 使用键值对RDD
   8. 编写和运行ApacheSpark应用
   9. 配置ApacheSpark应用
   10. ApacheSpark的并行处理
   11. Spark持久化
   12. ApacheSpark数据处理的常见模式
   13. DataFrames和SparkSQL
   14. ApacheKafka
   15. 使用ApacheFlume采集实时数据
   16. 集成ApacheFlume和ApacheKafka
   17. ApacheSparkStreaming:DStreams介绍
   18. ApacheSparkStreaming:批处理
   19. ApacheSparkStreaming:数据源

、课程目标

   ★☆ 通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
   ★☆ 在Hadoop集群上进行分布式存储和处理数据。
   ★☆ 通过在Hadoop集群上编写、配置和部署ApacheSpark应用。
   ★☆ 使用Sparkshell进行交互式数据分析。
   ★☆ 使用SparkSQL查询处理结构化数据。
   ★☆ 使用SparkStreaming处理流式数据。
   ★☆ 使用Flume和Kafka为SparkStreaming采集流式数据。

、培训对象

   ★☆ 本课程适合于具有编程经验的开发员及工程师。无需ApacheHadoop基础。
   ★☆ 培训内容中对ApacheSpark的介绍所涉及的代码及练习使用Scala和Python,因此需至少掌握这两个编程语言中的一种。
   ★☆ 需熟练掌握Linux命令行。
   ★☆ 对SQL有基本了解。

上一篇: 大数据Cloudera--ApacheHBase培训课程 下一篇: Cloudera--数据分析师:Pig、Hive和Impala培训课程

推荐课程

查看全部课程
上海腾科IT教育

上海腾科IT教育

上海分校

查看全部校区 进入官方主页