作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成。
Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重要。
Hive作业的规模决定着优化层级,一个Hive作业的优化和一万的Hive作业的优化截然不同。
拥有1万多个Hive作业的大电商如何进行Hive优化的?本系列课结合企业实战和场景从作业架构层面、Hql(Hive sql)语法层面、Hive参数层面依次讲述。
1:Hive体系结构及Hive作业形式
2:Hive优化策略大探底及架构优化案例一
3:架构优化案例二之降IO负载策略I
4:架构优化案例二之降IO负载策略II
5:架构优化案例二之降IO负载策略III—压缩和分布式缓存
6:Hive语法、参数层面优化一
7:Hive语法、参数层面优化二
8:Hive语法、参数层面优化三
掌握Hive中的SQL语法,可以使用Hive SQL实现海量数据分析任务
Hive海量数据分析