该阶段的学习为工程级学习阶段之一,能够实现复杂数据的降维处理等多种效果。 课程目标 1、了解各种数据准备和特征工程的方法 2、掌握数据记录级处理,特征构造的方法技巧与 经验 3、掌握特征转换,特征降维和特征选择的方法、技巧与经验 课程内容 什么是特征工程(概述特征构造用户行为特征提取特征处理 01衍生变量变量标准化变量二值化特征处理 02 数据分箱哑变量(独热编码特征处理 03 数据变换\缺失值处理组合特征特征选择 01- 单特征的预测能力特征选择 02 Wrapper特征选择 03- Embedded降维主成分分析(PCA ) 学习效果 1、能够把不同的数据利用不同的方法实现清洗与处理 2、能够实现对多种数据的特性选取与转换集的降维处理