算法建模少想获得最优策略算法的人员;*经验少想提升数据挖掘技能的人员业余时间多;想提高数据思维能力的人员。
在职提升和转岗人群:
*任务重想提高*效率的财务、市场等人员竞争压力大想突破职业瓶颈的产品、运营等人员行业挑战多想提升战略思维的决策、管理等人员。
转行数据分析人群;
自学难度大想零基础快速入门的人员升职加薪难想要跳槽大幅涨薪的人员行业不景气想进新兴数据行业的人员。
CDA报考人群;
报名参加CDA LevelI等级考试的考生;报名参加CDA Levell等级考试的考生;报名参加CDA Levellll等级考试的考生。
课程时间:全天根据学员时间灵活协调
贴心服务:免费测试,为学员*个性化学习方案及课程规划 免费自习室,学习顾问全程跟踪服务。
预习课
(录播)数据库SQL 1.数据库基本概念
2.DDL数据定义语言
3.DML数据操作语言
4.单表查询
5.多表查询
6.Python连接SQL
Python编程基础1.Python标准数据类型
2.控制流语句
3.自定义函数
4.异常和错误
5.类与面向对象编程
6.Numpy数组操作
7.用Python做数据分析,必会的库Pandas
8.用Pandas做数据清洗与数据探索
9.Python数据可视化库(Matplotlib,Seaborn)
数学与统计学基础1.线性代数
2.微积分
3.描述性统计
4.参数估计
5.假设检验
6.相关分析
7.卡方分析
8.一元线性回归理论推导
第6周周六ETL数据接入与数仓1.ETL基本概念与常用工具
2.基于Python的ETL程序开发
3.定时执行Python程序
4.ETL实战项目
5.数据接入策略与调度工具
机器学习与人工智能
(Level 3)周日大数据平台Spark,数据挖掘导论1.分布式存储与计算
2.Spark与Flink*原理
3.Spark基本语法
4.使用PySpark实现分布式计算
5.数据挖掘导论
6.梯度下降
第7周周六决策树1.决策树与信息熵
2.ID3,C4.5,CART树
3.模型调参:网格搜索
4.决策树的PySpark实现
5.决策树之欺诈识别案例
周日正则回归,Pipeline 1.正则项的理论基础
2.带正则项的回归
3.Pipeline*流专题
4.使用Pipeline提交算法模型
第8周周六关联规则与协同过滤1.关联规则(关联规则的概念,评估指标,Apriori算法)
2.协同过滤
3.大数据环境下的协同过滤实现
4.产品组合策略-零售产品捆绑销售策略分析案例
周日集成算法基础1.集成学习的理论基础
2.Bagging,Boosting,Stacking
3.AdaBoost
4.随机森林及其Spark实现
5.GBDT,XGBoost
第9周周六爬虫,文本分析1.数据的爬取(http原理,requests应用,HTML结构及xpath应用)
2,非结构化数据的加工处理
3.文本数据处理之正则表达式
周日机器学习进阶,人工智能基础1.LightGBM,CatBoost
2.数据不平衡问题
3.贝叶斯搜索调参
4.贝叶斯调参python实践
5.人工智能基础
6.caie网页端使用
第10周周六人工智能之神经网络1.深度神经网络基础:感知器及多层感知器
2.神经网络架构
3.BP反向传播算法
4.梯度与学习率专题
5.卷积神经网络
6.Pytorch框架与代码实践
7.图像分析-手写数字自动识别
周日聚类分析进阶与异常识别1.聚类分析进阶(密度聚类,高斯混合聚类,谱聚类)
2.异常识别(孤立森林,局部异常因子)
3.交易反欺诈-异常交易识别案例
第11周周六人工智能NLP之文本挖掘1.分词与词性标注
2.文本信息提取
3.词嵌入(CBOW与Skip-gram)
4.构建文本信息库
5.文本聚类算法
6.文本分类算法与Pytorch实现
周日大型项目案例实战项目-金融风控大型案例
第12周周六人工智能NLP之大语言模型LLM 1.循环神经网络RNN
2.编码器与迁移学习
3.残差网络ResNet
4.预训练框架Transformer
5.大语言模型LLM技术架构与训练方法
6.开源模型平台与框架
7.Openai api之python代码实践
第13周周六大语言模型LLM前沿方法1.知识学习
2.GPT之Fine tuning
3.LLM的本地化部署
4.本地化LLM的Fine tuning
5.Agent
6.向量数据库与知识库
7.人工智能NLP的前沿方向
选修课选修课1、互联网数字化运营【18课时】
2、何为数据产品经理?【1课时】
3、Python爬虫【15课时】
4、人工智能(深度学习)实战之图像识别【6课时】
5、Tableau多维可视化分析【3课时】
6、SPSS统计分析【12课时】
长沙国富如荷教育