数据挖掘的功能

187人已阅读 2018-09-04 13:54:43
导读 前面一期我们讲了大数据挖掘的方法,那些方法能够帮助我们更快的获得数据,并且为之后的数据分析做好准备,我们只是讲了数据挖掘的方法并没有说其功能,泛艺学苑今天就来讲讲数据挖掘的功能。
设计类 编程类 其他

新闻详情

2018-09-04 13:54:43

数据挖掘的功能

  前面一期我们讲了大数据挖掘的方法,那些方法能够帮助我们更快的获得数据,并且为之后的数据分析做好准备,我们只是讲了数据挖掘的方法并没有说其功能,泛艺学苑今天就来讲讲数据挖掘的功能。

  数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。
  自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报*的用户,其它可预测的问题*括预报破产以及认定对指定事件最可能做出反应的群体。
  关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。
  聚类:数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要*括传统的模式识别方法和数学分类学。80年代初,Michalski提出了概念聚类技术,其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。
  概念描述:概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。
  偏差检测:数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差*括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。

 泛艺学苑专注于互联网职业教育,依托互联网教学平台,帮助学员打破空间限制,让学员能够享受到一线城市的优质师资,以灵活的教学方式和与时俱进的教学内容,帮助众多的学员成功*。

上一篇: 数据挖掘的几个方法 下一篇: 介绍几种吸睛的网页首屏设计方法

相关文章

推荐课程

查看全部课程
天津泛艺学苑

天津泛艺学苑

和平校区

查看全部校区 进入官方主页