存储技术的迅速发展,特别是硬件价格的下降,使得数据的积累速度不断提高,面对日益庞大的数据资源,我们迫切需要强有力的工具来挖掘其中有用的信息。Microsoft最新的数据库平台SQL Server 2005中的数据挖掘组件是数据挖掘工具的典型代表。
SQL Server 2000中包括的数据挖掘算法只有决策树算法和聚类算法,与之相比,SQL Server 2005中引入了多个新的数据挖掘算法,包括贝叶斯算法、时间序列算法、序列聚类算法、关联规则算法和神经网络算法。与传统数据挖掘工具相比,SQL Server 2005数据挖掘功能具备许多的优势,SQL Server 2005数据挖掘功能与所有SQL Server产品实现了集成,包括SQL Server、SQL Server Integration Services和Analysis Services。SQL Server 2005数据挖掘功能具有易用性、可伸缩性和可扩展性等特点,同时它包含简单而丰富的API。
从SQL Server 2000到SQL Server2005,经历5年SQL Server数据挖掘的功能实现了一个跨跃式的发展,可谓“五年磨一剑”,也正是本书的ZhaoHui Tang和Jamie MacLennan两位作者带领他们的团队紧密合作的顶峰。对于本书讲述算法的每一章(包括4、5、6、7、8、9、10章),作者不仅对每一个算法进行了详细的讲述,还在每一章的引言部分给您描述本章算法能应用的一个实际场景,很容易吸引读者往下阅读。
我们作为数据挖掘的研究者,在翻译SQL Server 2005数据挖掘时,发觉在SQL Server 2005中包含的数据挖掘算法是如此之多,以至于超过了SAS、SPSS和IBM的Intelligent Miner等数据挖掘工具。同时我们作为数据挖掘的工作者,在使用SQL Server 2005进行数据挖掘的同时,切身体会到了SQL Server 2005数据挖掘功能与所有SQL Server产品实现集成给我们的数据挖掘工作带来的便利,以及它的易用性、可伸缩性和可扩展性。
正如本书前言所述,本书对于使用SQL Serve 2005进行数据挖掘的用户很有用,可谓及时性、实用性、可靠性集于一体。其中,第1章对数据挖掘进行了一个基本的介绍,第2章讲述了OLE DB for DM规范,第3章讲述了如何使用SQL Server 2005的数据挖掘工具,第4章到第10章每一章讲述了一个数据挖掘算法,第11章讲述了如何对OLAP立方体进行数据挖掘,第12章讲述了如何使用SSIS,第13章和第14章对数据挖掘的体系结构和API进行了讲述,第15章实现了一个Web交叉销售应用程序,第16章讲述了如何使用Microsoft Excel进行高级的预测,第17章讲述了有关扩展SQL Server数据挖掘的知识,第18章对本书以及SQL Server 2005中数据挖掘的功能进行了总结,以及给出了一些附加资源。附录A描述了本书使用的4个数据集以及如何导入这些数据集;附录B描述了SQL Server 2005支持的VBA函数和Excel函数。对于打算采用本书作为教材的老师,则建议您讲述第1章到第10章,以及第15章,如果时间允许,您可以讲述第11、12、17章,对其他章感兴趣的学生可以自学。
译者
2006年5月于国防科技大学





