是一个全球知名的数据科学竞赛在线平台,由Anthony Goldbloom和Ben Hamner于2010年在墨尔本创立,由google收购。Kaggle一开始以Data Mining起家,为了是可以快速高效的解决最棘手的问题。大部分的竞赛均由企业或研究者发布,将数据,问题和期望指标同步更新,以竞赛奖励的方式向全球征集解决方案。对问题发布者来说,他可以方便的筛选出最有成效的方案,而对参与者来说,不仅是考验自己能力,更是一场实战经验。对于申请Data Science相关专业的同学来讲,大数据的走红使得Data Science的申请竞争愈演愈烈,因此如何提升背景也是大家非常关心的问题。而Kaggle正好给大家提供了一个非常好的平台,在这里人人有参与项目的机会,无论你的背景是什么,都可以通过选择合适的项目来找到属于自己的位置,利用自己的专业优势,为整个team作出贡献,丰富简历的同时也能学习一些干货,为自己以后的学习打好基础。而其在领域内的知名度足以让你在众多申请者中脱颖而出,绝对是申请利器
建议学员对python有一定的基础,同时具备微积分和概率的基础知识
>部分题目示:
1.Two sigma:Using News to Predict Stock Movements(Use news analytics to predict stock price performance)
2.Jigsaw Unintended Bias in Toxicity Classification(Detect toxicity across a diverse range of conversations)
3.Santander Customer Transaction Prediction(Can you identify who will make a transaction?)
第-周上午(2h)
1.赛事入门讲解
Kaggle赛事介绍,过往案例分析
2.基础培训
Python基础框架梳理、Machine Learning入门
第-周下午(2h)
1.基础培训
模型应用:
Regression Methods
Perceptron
Logistic Regression
Neural Network
2.比赛实战.
当期比赛题目分析、实践
2.比赛实战
当期比赛题目分析、实践
第二周上午(2h)
1.基础培训
模型应用:
Regression Methods
Perceptron
Logistic Regression
Neural Network
第二周下午(2h)
1.比赛实战
往期比赛题目调试、提交