数据挖掘并不是购买一个软件,随便找几个人就可以完成的事情。它是一个系统工程,需要有计划、有组织地进行。问题定义和用户定义是实施数据挖掘的两个关键要素。
用户真正需要的是什么?这个尺度很难把握。从技术上分析,如果数据挖掘系统所提交的结果只是简单的数据报表,这样很容易做到,但是用户却不喜欢。然而,如果直接将提出数据挖掘系统的使用可以在将来的两年中为公司多争取到5%的市场份额或者减少3%的客户欺诈行为,虽然用户会欢欣鼓舞,但在技术上是非常难于达到的。显然,除了数据挖掘系统本身以外,牵扯了太多的其他部门和公司外面的环境因素。在定义业务问题时,一个好的处理原则是尽可能地选择具有实际意义的小问题,而且牵扯的部门或公司外环境因素越少越好。
各类用户使用系统的方式和目的不同,他们的操作水平和专业知识也不尽相同。如果系统过于复杂,会使一些技术知识缺乏的人员无法使用;而如果系统过于简单,虽然能够为大多数人所用,但是却可能导致部分功能的丧失。特别是*种情况,技术人员花费了很大的力气,企业也付出了大量开支,却得不到效益。
对主要的用户进行适当的培训在一定程度上可以防止水平太差的群体影响系统的复杂性和功能。培训的内容可以*括:数据挖掘技术的介绍,本企业所用系统的操作,业务流程的改变等。在培训的同时,还可以进行一定的讨论,比如:用户们对数据挖掘系统的期望和建议、主要的问题等。