老男孩倡议共建大数据生态圈

222人已阅读 2018-12-23 11:02:21
导读 “21世纪最缺的是什么?人才!”。在大数据发展如此之快的今天,大数据工程师已经成为一个新兴职业。大数据是信息技术,是人和人、人和机器、机器和机器交互的内容特征,是最底层的信息技术,是基本标配。
IT培训

新闻详情

2018-12-23 11:02:21
详细介绍

   “21世纪最缺的是什么?人才!”。在大数据发展如此之快的今天,大数据工程师已经成为一个新兴职业。大数据是信息技术,是人和人、人和机器、机器和机器交互的内容特征,是最底层的信息技术,是基本标配。今天我们就来看看大数据。

   1、HBase

    是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构化数据集群。像Facebook,都拿它做大型实时应用。

    2、Hive

    Facebook领导的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计。像一些datascientist就可以直接查询,不需要学习其他编程接口。

  

       3、Pig

    Yahoo开发的,并行地执行数据流处理的引擎,它*含了一种脚本语言,称为PigLatin,用来描述这些数据流。PigLatin本身提供了许多传统的数据操作,同时允许用户自己开发一些自定义函数用来读取、处理和写数据。在LinkedIn也是大量使用。

    4、Cascading/Scalding

    Cascading是Twitter收购的一个公司技术,主要是提供数据管道的一些抽象接口,然后又推出了基于Cascading的Scala版本就叫Scalding。Coursera是用Scalding作为MapReduce的编程接口放在Amazon的EMR运行。

    5、Zookeeper

    一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现。

    6、Oozie

    一个基于*流引擎的开源框架。由Cloudera公司贡献给Apache的,它能够提供对HadoopMapReduce和PigJobs的任务调度与协调。

    7、Azkaban

    跟上面很像,Linkedin开源的面向Hadoop的开源*流系统,提供了类似于cron的管理任务。

    8、Tez

  Hortonworks主推的优化MapReduce执行引擎,与MapReduce相比较,Tez在性能方面更加出色。

  想要学习大数据,建议从应用切入、以点带面,先从一个实际的应用领域需求,搞定一个一个技术点,有一定功底之后,再举一反三

  横向扩展,这样学习效果就会好很多。

  

  本文章版权归老男孩教育所有。转载请注明出处。有任何疑问可以随时给我们网站留言。

上一篇: 推动人工智能进程的阿里云 下一篇: IT初学者到大牛如何进阶?

相关文章

推荐课程

查看全部课程
上海老男孩教育

上海老男孩教育

上海校区

查看全部校区 进入官方主页