数据挖掘

出版时间:2005-9  出版社:机械工业出版社  作者:威滕  页数:524  
Tag标签:无  

内容概要

本书对1999年的初版做了重大的改动。虽说核心概念没有变化,但本书进行了更新使其能反映过去5年里的变化,参考文献几乎翻了一番。新版的重要部分包括:30个新的技术章节;一个加强了的具有交互式界面的Weka机器学习工作平台;有关神经网络的完整信息,一个有关贝叶斯网络的新节;等等。  本书提供了机器学习概念的完整基础,此外还针对实际工作中应用相关工具和技术提出了一些建议,在本书中你将发现:   ●成功数据挖掘技术的核心算法,包括历经考验的真实技术及前沿的方法。   ●转换输入或输出以改善性能的方法。  ●可下载的Weka软件??一个用于数据挖掘任务的机器学习算法的集合,包括用于数据预处理、分类、回归、聚类、关联规则以及在新的交互式界面上可视化的工具。

作者简介

Lan H.Witten新西兰怀卡托大学计算机科学系教授,ACM和新西兰皇家学会成员。他曾荣获2004年国际信息处理研究联合会颁发的Namur奖项,这是一个两年一度的荣誉奖项,用于奖励那些在信息和通信技术的社会应用方面做出杰现贡献及具有国际影响的人。他的著作包括《Managing Gi

书籍目录

ForewordPrefacePart I Machine learning tools and techniques 1. What?s it all about?   1.1 Data mining and machine learning   1.2 Simple examples: the weather problem and others   1.3 Fielded applications   1.4 Machine learning and statistics   1.5 Generalization as search   1.6 Data mining and ethics   1.7 Further reading  2. Input: Concepts, instances, attributes   2.1 What?s a concept?   2.2 What?s in an example?  2.3 What?s in an attribute?   2.4 Preparing the input   2.5 Further reading  3. Output: Knowledge representation   3.1 Decision tables   3.2 Decision trees   3.3 Classification rules   3.4 Association rules   3.5 Rules with exceptions   3.6 Rules involving relations  3.7 Trees for numeric prediction   3.8 Instance-based representation   3.9 Clusters   3.10 Further reading  4. Algorithms: The basic methods   4.1 Inferring rudimentary rules   4.2 Statistical modeling   4.3 Divide-and-conquer: constructing decision trees   4.4 Covering algorithms: constructing rules   4.5 Mining association rules   4.6 Linear models   4.7 Instance-based learning   4.8 Clustering   4.9 Further reading  5. Credibility: Evaluating what?s been learned   5.1 Training and testing   5.2 Predicting performance   5.3 Cross-validation   5.4 Other estimates   5.5 Comparing data mining schemes   5.6 Predicting probabilities   5.7 Counting the cost   5.8 Evaluating numeric prediction   5.9 The minimum description length principle   5.10 Applying MDL to clustering   5.11 Further reading  6. Implementations: Real machine learning schemes   6.1 Decision trees   6.2 Classification rules   6.3 Extending linear models   6.4 Instance-based learning   6.5 Numeric prediction   6.6 Clustering   6.7 Bayesian networks  7. Transformations: Engineering the input and output   7.1 Attribute selection   7.2 Discretizing numeric attributes   7.3 Some useful transformations   7.4 Automatic data cleansing   7.5 Combining multiple models   7.6 Using unlabeled data   7.7 Further reading  8. Moving on: Extensions and applications   8.1 Learning from massive datasets   8.2 Incorporating domain knowledge   8.3 Text and Web mining   8.4 Adversarial situations   8.5 Ubiquitous data mining   8.6 Further reading Part II: The Weka machine learning workbench  9. Introduction to Weka   9.1 What?s in Weka?   9.2 How do you use it?   9.3 What else can you do?  9.4 How do you get it?  10. The Explorer   10.1 Getting started   10.2 Exploring the Explorer   10.3 Filtering algorithms   10.4 Learning algorithms   10.5 Meta-learning algorithms   10.6 Clustering algorithms   10.7 Association-rule learners   10.8 Attribute selection  11. The Knowledge Flow interface   11.1 Getting started   11.2 Knowledge Flow components   11.3 Configuring and connecting the components   11.4 Incremental learning  12. The Experimenter   12.1 Getting started   12.2 Simple setup   12.3 Advanced setup   12.4 The Analyze panel  12.5 Distributing processing over several machines  13. The command-line interface   13.1 Getting started   13.2 The structure of Weka   13.3 Command-line options  14. Embedded machine learning …… 15. Writing new learning schemes References Index

图书封面

图书标签Tags

评论、评分、阅读与下载


    数据挖掘 PDF格式下载


用户评论 (总计34条)

 
 

  •   是我们machinelearninganddatamining的教材之一,不过这本书是围绕weka的,TomMitchell的MachineLearning是理论为主的。要做算法的implementation的时候,用这本书很好
  •   去年暑假开始学习weka,是冲着weka部分买的,还不错~挺实用的一本书,到现在还在有看!!
  •   好书,翻译版的书很多地方看不懂,有英文版的就好了
  •   很好的一本书,不管入门和专家本书都有很大作用
  •   书不错,价格也好,而且原版的竟然比翻译的便宜,哈哈
  •   这是本经典的DataMining书籍,值得一读!
  •   首先,数的印制和纸质不错,影印版一样很清晰;
    其次,内容正在看,就目前所看来说,应该是本不错的书;
  •   首先是书,质量不错,印刷的也很精良。与我的要求相符。然后是送货,比预想中的要快,并且不要运费,服务态度很好。
  •   送货很快。正再看
  •   书上有讲一款软件,用于机器学习方面的。不过还没试过。
  •   从事数据挖掘领域研究,买回来还没怎么学习呢,不过是professor推荐的,应该不错
  •   可以从入门学习。例子很多,很容易把握概念。You can study from the very basic concept with this book as it uses a lot of examples to explain every algorithm and principle. But the only thing that I didn't ***e is the book cover is a little bit dirty.
  •   英文原版的不错读起来流畅不想一些翻译的烂书不知所云
  •   上学的时候老师推荐的书。英文版的看起来有些吃力,但是比中文版要好一些。可以跟中文版对照着学习
  •   课本不错,很新,,,大家要记得要发票啊。
  •   嗯,看了一小部分了,很不错,算是实用。
  •   还不错的,我是和中文对照看的~
  •   刚看。冲着作者名气买的,应该还不错。
  •   买了一周了,看来前4章,有点失望。语言对读者的重要性不言而喻,尤其是对以英语为第二语言的读者。我对这本书的语言写作风格很是不爽。作者做为一个新西兰人使用的书面英语非常晦涩,经常使用一些非主流的单词。先忍一忍,赶快把后面的weka工具包那部分看完。
  •   一般,印刷质量不行
  •     这本书确实如所知道的那样,翻译得很水。很多一些概念的东西就像把你隔在某种屏障外,然后其实说的并不是那么枯燥的东西…………
      本书主要还是介绍机器学习的,用这本书的目的就是为了了解weka中算法实现的思想。从这点出发这本书还算是比较值当的了,比官方的文档确实还是要精细更好一些……
  •     作者可以说是享誉盛名,但是这本书写出来,基本上章法全无。理论和例子基本上没有几个是适合入门者的,加上翻译有些地方表意不清。初阶入门者看了的话,肯定一团迷雾。
      评论太短了嘛?评论太短了嘛?评论太短了嘛?评论太短了嘛?评论太短了嘛?评论太短了嘛?评论太短了嘛?评论太短了嘛?
  •     -----------------------------------------
      
      外文教材, 外文参考书 请咨询
      
      http://shop35575714.taobao.com
      
      
      ----------------------------------------
  •     我觉得,可以当作weka的使用手册来看,但是比weka自带的指南写的好看。
      
      算法部分的介绍很详细。
  •     这本书虽然标题是Data Mining,但是核心内容还是机器学习。我理解“数据挖掘”主要指的还是KDD,即基于数据库的知识发现。在这个领域,基本的方法是聚类和关联规则发现;而在机器学习领域,主要研究的是分类。
      
      这本书的内容主要是分类,也有一部分聚类的内容,关联规则发现基本上没有讲。但它对分类讲的很详细,主要的思想都涉及到了,体系整理很好。它对相关的知识,如分类算法的性能估计,如何在分类中结合成本考虑等也做了详细的介绍。因此,认真读读这本书对于学好用好分类是很有帮助的。
      
      它的第二部分介绍了Weka这个机器学习框架的使用。用好这个框架能够帮助简化机器学习算法研究中的一些辅助工作,作用还是很大的。
      
      因此,推荐对机器学习,特别是分类有兴趣的同志们看看这本书。
  •     这本书我觉得最值得阅读的地方还是后面WEKA的部分,当然了前面也有关于WEKA文件的表示说明。至于其他的方面么,这本书只能说是还凑合。当然了如果你已经有了本书,又不想买其他的数据挖掘方面的教程,还是不错的。呵呵
  •     这种书的翻译都是一个导师,找多个研究生每人分俩章节,对这金山词霸翻译的,能好到哪里。所以要读还是读原版。
  •       翻译的不大好,譬如:指针与引用的"引用(reference)",被翻译成"参考";JavaBean被翻译为Java豆;异常的"抛出"被翻译为"丢弃"....
        不过对于想学习Weka,研究Weka源码的朋友来说,该书的算法介绍和软件使用还是很不错的.
  •     这本dm的书啃完了,觉得有点这个书有点“偏见”,怎么理解呢
      前面的东西不错哦,可是后半部分的Weka平台我个人觉得翻翻就行了,要学还不如看看spss的书呢,前面关于机器模型的建立的数学基础要求的不是很高,所以很适合一般没有学过随机过程的人看看,要是数学很牛的人,可以看看这个《模式分类》,呵呵这本书也不错,偶正在读,不过这书很BT,我也是慢慢的啃,挺“费牙”的,呵呵。
  •   呵呵,你转行了?
  •   我都转了一年了。。。。
  •   刚刚买了本.十一假期看.
  •   这个翻译太搞了……
  •   这本书是英文版,何来的翻译哦
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7