很多学科都面临一个普遍问题:如何存储、访问异常庞大的数据集,并用模型来描述和理解它们?这些问题使得人们对数据挖掘技术的兴趣不断增强。长期以来,很多相互独立的不同学科分别致力于数据挖掘的各个方面。本书把信息科学、计算科学和统计学生在数据挖掘方面的应用融��在一起,是**本真正的跨学科教材。
本书由一部分构成。**部分是基础,介绍了数据挖掘算法及其应用所依赖的基本原理。讨论方示直观易懂,深入浅出。第二部分是数据挖掘算法,系统讨论了如何构建求解特定问题的没算法。讨论的内容包括用于分类和回归的树及规则,关联规则、信念网络、传统统计模型,以及各种非线性模型,比如神经网络和“基于记忆”的局部模型。第三部分介绍了如何应用前面讨论的算法和原理来解决现实世界中的数据挖掘问题。谈到的问题包括元数据的作用,如何处理残缺数据,以及数据预处理。