我们尚学堂云计算机器学习课程主要针对那些在职人员,R本身是一款十分优秀的数据分析和数据可视化软件,同时作为*代机器学习的工具,其中*括大量用于机器学习的添加*。此部分带领大家学习R语言更是带领大家进入机器学习的领域,机器学习算法为主线的同时,通过案例学习将会让大家对内容脉络掌握的更加清晰。
第二阶段:机器学习 | |
R语言 机器学习 |
R本身是一款十分优秀的数据分析和数据可视化软件,同时作为*代机器学习的工具,其中*括大量用于机器学习的添加*。此部分带领大家学习R语言更是带领大家进入机器学习的领域,机器学习算法为主线的同时,通过案例学习将会让大家对内容脉络掌握的更加清晰。 |
1) R语言介绍,基本函数,数据类型
2) 线性回归
3) 朴素贝叶斯聚类
4) 决策树分类
5) k均值聚类 a) 离群点检测
6) 关联规则探索
7) 神经网络
|
|
Mahout 机器学习 |
Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout*含许多实现,*括聚类、分类、推荐过滤、频繁子项挖掘。Mahout通过使用 Apache Hadoop,可以有效地扩展到云中。被业界奉为第二代机器学习工具。此部分过后大家不仅会学习到mahout的组件而且会有项目让大家真正把它应用到*中。 |
1) 介绍为什么使用它,它的前景 a) 简单介绍Mahout b) 简单介绍机器学习 c) 实例演示Mahout单机推荐程序 2) 配置安装(hadoop2.x版本的)编译安装步骤说明 a) 命令行中测试运行协同过滤概念 3) 推荐 a) 讲解基于用户的协同过滤 b) 讲解基于物品的协同过滤 4) 分类 a) 分类概念 b) 分类的应用及Mahout分类优势 c) 分类和聚类、推荐的区别 d) 分类*原理 e) 分类中概念术语 f) 分类项目*流 g) 如何定义预测变量 h) 线性分类器的介绍,及贝叶斯分类器 i) 决策树分类器的介绍,及随机森林分类器 j) 如何使用贝叶斯分类器和随机森林分类器的代码展示 5) 聚类 a) 聚类概念 b) 聚类步骤流程 c) 聚类中的距离测度 d) 讲解K-means聚类 e) K-means聚类算法展示 f) 聚类其他算法 g) 介绍TF-IDF h) 归一化 i) 微博聚类案例 |
|
项目实战 | 微博营销数据挖掘项目 使用数据来自微博平台,项目目标通过机器学习所学知识挖掘目标客户群体,找到代言人进行微博营销广告投放。 |
项目技术架构体系:
a) 分布式平台 Hadoop,MapReduce
b) 数据采集 Flume
c) 数据清洗 ETL
d) 数据库 Hbase,Redis
e) 机器学习 Mahout
|