1.HDFS数据存储是由哪个程序负责的?
答:Datanode
2.Hadoop的作者是谁?
答:dougcutting
3.集群最主要的瓶颈是?
答:磁盘
4.Hadoop运行模式是?
答:单机版伪分布式分布式
5.安装CDH的方法由CLOUDERA提供,它的安装方法是?
答:CiouderamanagerTarballYumRpm
6.哪些项目可以作为集群的管理?
答:PuppetPdshZookeeper
常见的大数据面试题,拿走不谢!
7.spark和hadoop的区别,和各自的优势
答:Spark和hadoop都是大数据应用框架系统。spark速度快,易于使用,是大数据学习时需要使用的系统;hadoop是分布式文件系统,其实就是一种软件库和框架。Spark和hadoop是一种互相共生的关系,hadoop拟补了spark没有的功能性,spark为数据提供了内存整理。
8.String和stringBuffer的区别是什么
答:string是对象是不可变的对象,不能修改它的值,stringbuffer是一个可变对象,对他进行修改的时候不会像string那样重新建立对象。
9.Java中,int和integer的区别
答:int是基本数据类型,integer是一种包装,intrger可存储int并添加int。
10.Arraylist和linkedlist的特性
答:ArrayList采用的是通过数字组合的方式保存对象的,并将对象放在连续的位置中,缺点是插入删除时非常麻烦;
LinkedList采用的是将对象存放在独立的空间中,而且在存放中还保存下一个对象的搜索引擎,缺点是查找比较麻烦,要从*个开始。