本课程为腾科IT教育关于大数据Cloudera检索培训课程,主要适合希望进一步提升自己的开发人员或工程师,帮助学员通过相关的认证考试,提升学员实力,增加学员的市场竞争力!
1. Cloudera Search概述
2. 执行基本查询
3. 编写功能更强大的查询
4. 准备索引文档
5. 通过MapReduce批量索引HDFS数据
6. 通过Flume的近实时索引
7. 通过Lily索引HBase数据
8. 以其他语言和格式索引数据
9. 内容提取
10. 提高搜索质量和性能
11. 构建搜索用户界面
12. 应用程序中
13. 部署注意事项
1.对存储在HDFS和HBase中的数据进行批量索引。
2.通过Flume以近实时的方式执行流数据的索引。
3.以多语言和多文件格式对内容进行索引。
4.通过Morphlines处理和转换输入数据。
5.使用Hue创建索引的用户界面。
6.将Cloudera检索系统与外部应用程序进行整合。
7.使用层面搜索(faceting)、高亮(highlighting)、拼写纠错等功能改善搜索体验。
1.专门针对至少基本了解Hadoop和具备通用语言(例如Java、C、C ++、Perl或Python)编程经验的开发人员和工程师设计的。
2.培训学员应非常熟悉Linux命令行,并且应该能够执行基本任务(例如,创建和删除目录、查看和更改文件权限、执行脚本、并检查文件输出)。
3.不要求培训学员必需具备Apache Solr或Cloudera检索系统使用经验,同时也不要求具备HBase或SQL使用经验。