本课程为腾科IT的数据分析师相关的培训课程,学员通过子啊腾科的系统培训,不断的提升自我,使自己的知识上升到一个新的水平,增加相关的职业技能,更好的进行*,增加核心竞争力!
1. Hadoop基础知识
2. Pig简介
3. Pig基本数据分析
4. 使用Pig处理复杂的数据
5. Pig多数据集操作
6. Pig故障诊断和性能优化
7. Hive和Impala简介
8. 使用Hive和Impala进行数据查询
9. Hive及Impala数据管理
10. 数据存储和性能
11. 使用Hive和Impala进行关系数据分析
12. 复杂数据类型
13. 使用Hive及Impala分析文本数据
14. Hive优化
15. Impala优化
16. 扩展Hive及Impala
17. 选择好工具
★☆ 使用Pig,Hive及Impala获取、存储及分析数据。
★☆ 使用Hadoop工具执行基本的ETL*(抽取-extract,转换-transform和加载-load)。
★☆ 使用Pig、Hive及Impala改善典型分析任务的效率。
★☆ 关联不同及丰富的数据源以获取全面和真实的商业价值。
★☆ 对数据集进行交互式和复杂查询。
1. 需具备一定的SQL知识水平。
2. 基本熟悉Linux命令行。
3. 培训学员至少熟悉一种脚本语言知识(例如,Bash脚本编程、Perl、Python和Ruby)将会更有帮助,但不是必需的。