1.有python基础
2.有一定的数据基础
l掌握数据分析的流程
l掌握python数据分析核心库的使用,如numpy、pandas、matplotlib
l了解常用数据分析(挖掘)算法的原理,熟悉机器学习的各个环节,并能利用相应的算法建模
l熟练使用sk-learn进行数据挖掘
章节 |
主要授课内容 |
|
|
Python数据分析概述 |
1.数据分析的概念、流程、应用场景 2.数据分析常用的工具、python数据分析的优势、常用类库的介绍 3.Jupyter Notebook的安装及使用 |
||
Numpy数值计算基础 |
1.ndarray的创建、访问、常用属性 2.矩阵的创建 3.通用函数ufunc 4.广播机制 5.数学知识 6.简单统计分析,读写文件、排序、去重、常用统计函数 |
||
Pandas统计分析基础 |
1.Series常用操作 2.DataFrame常用操作 3.读写不同数据源 4.数据过滤与转换 5.时间序列操作 6.分组与聚合 7.透视与交叉表 |
|
|
利用pandas进行数据预处理 |
1.合并数据,堆叠合并、主键合并、重叠合并 2.清洗数据,处理重复值、缺失值、异常值的处理 3.标准化数据,离差标准化、标准差标准化、小数定标标准化 4.转化数据 ,类别型特征处理为哑变量,连续性特征离散化处理 |
|
|
数据可视化 |
1.数据可视化概述 2.常用图表,如柱状图、饼状图、直方图、箱线图等的介绍 3.matplotlib绘图基础,如基础语法、rc参数、标签刻度、子图等 4.matplotlib绘图实战 5.pandas绘图实战 |
|
|
机器学习与挖掘建模 |
1.机器学习概述 2.机器学习分类 3.机器学习流程 4.机器学习评估 5.经典机器学习算法原理剖析,如 knn、kmeans、朴素贝叶斯、决策树、线性回归、逻辑回归、支持向量机、关系分析等 6.关联规则算法 7.时序模式 8.物体推荐算法 9.使用sk-learn建模,*括数据集划分、数据预处理、模型训练、模型评估等 |
|
|
数据分析与挖掘实战案例 |
1.招聘网站需求分析 2.航空公司客户价值分析 3.财政收入预测分析 4.二手房房价分析 |