基于Clementine的数据挖掘

出版时间:2012-3  出版社:中国人民大学  作者:薛薇//陈欢歌  页数:467  
Tag标签:无  

内容概要

  数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。
  作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:
  
·以数据挖掘过程为线索介绍clementine软件。本书以数据挖掘的实践过程为主线,从clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握clementine的基本功能和一般方法,并可迅速运用到实际工作中。
  
·数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
  
·数据挖掘方法讲解全面,语言通俗。本书对clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。

作者简介

  ·薛薇,工学硕士、经济学博士,中国人民大学应用统计学科研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计分析方法、统计和数据挖掘软件应用、统计数据库系统研发等方面,涉足网络新媒体传播和互动模式建模、政府和官方微博分析、学科学术热点跟踪等文本挖掘和统计应用领域,以及以数据挖掘为依托的客户关系管理等。主要著作:《SPSS统计分析方法及应用》、《C1ementine数据挖掘方法及应用》、《基于信息技术的统计信息系统》。

书籍目录

第1章 数据挖掘和clementine使用概述
 1.1数据挖掘的产生背景
 1.2什么是数据挖掘
 1.3clementine软件概述
第2章 clementine的数据读入和数据集成
 2.1变量类型
 2.2读人数据
 2.3生成实验方案
 2.4数据集成
第3章 clementine的数据理解
 3.1变量说明
 3.2数据质量的评估和调整
 3.3数据的排序
 3.4数据的分类汇总
 3.5用户报表
第4章 clementine的数据准备
 4.1变量变换
 4.2变量派生
 4.3数据精简
 4.4数据筛选
 4.5数据准备的其他工作
第5章 clementine的基本分析
 5.1数值型变量的基本分析
 5.2两分类型变量相关性的研究
 5.3两总体的均值比较
 5.4rfm分析
第6章 clementine的数据精简
 6.1变量值的离散化处理
 6.2特征选择
 6.3因子分析
第7章 分类预测:clementine的决策树
 7.1决策树算法概述
 7.2clementine的c5.0算法及应用
 7.3clementine的分类回归树及应用
 7.4clementine的chaid算法及应用
 7.5clementine的quest算法及应用
 7.6模型的对比分析
第8章 分类预测:clementine的人工神经网络
 8.1人工神经网络算法概述
 8.2clementine的b-p反向传播网络
 8.3clementine的b-p反向传播网络的应用
 8.4clementine的径向基函数网络及应用
第9章 分类预测:clementine的支持向量机
 9.1支持向量分类的基本思路
 9.2支持向量分类的基本原理
 9.3支持向量回归
 9.4支持向量机的应用
第10章 分类预测:clementine的logistic回归分析
 10.1logistic回归分析概述
 10.2二项logistic回归分析
 10.3二项logistic回归分析的应用
 10.4多项logistic回归分析及应用
第11章 分类预测:clementine的判别分析
 11.1距离判别法
 11.2fisher判别法
 11.3贝叶斯判别法
 11.4判别分析的应用
第12章 分类预测:clementine的贝叶斯网络
 12.1贝叶斯方法基础
 12.2贝叶斯网络概述
 12.3tan贝叶斯网络
 12.4马尔科夫毯网络
 12.5贝叶斯网络的应用
第13章 探索内部结构:clementine的聚类分析
 13.1聚类分析的一般问题
 13.2clementine的k-means聚类及应用
 13.3clementine的两步聚类及应用
 13.4clementine的kohonen网络聚类及应用
 13.5基于聚类分析的离群点探索
第14章 探索内部结构:clementine的关联分析
 14.1简单关联规则及其有效性
 14.2clementine的apriori算法及应用
 14.3clementine的gri算法及应用
 14.4clementine的序列关联及应用
参考文献

章节摘录

版权页:第一章 数据挖掘和Clementine使用概述20世纪90年代中后期以来,数据挖掘作为具有鲜明跨学科色彩的应用研究领域,已成为众多行业数据分析者瞩目的焦点。数据挖掘是一个利用各种方法,从海量数据中提取隐含和潜在的对决策有用的信息和模式的过程。因具有处理和分析海量数据的能力,注重弱化分析方法本身对数据的限制,以满足数据建模的合理性和适应性,强调与计算机技术相结合,以实现数据分析的可操作性和可实现性,数据挖掘正逐步成为数据分析应用实践的新生代和领军者。同时,随着数据挖掘方法的不断成熟及其应用的日益普及,数据挖掘软件的研发也取得了可喜的成果。目前,以SPSSClementine为代表的数据挖掘软件,已行之有效地将束之高阁的数据挖掘理论成果解放到数据分析实践中,并普遍应用于商业、社会、经济、教育、金融、医学等领域,成为数据分析的主流工具。1.1 数据挖掘的产生背景数据挖掘是在计算机数据库技术蓬勃发展、人工智能技术应用领域不断拓展、统计分析方法不断丰富发展的进程中,有效迎合数据分析的实际需求而逐步形成和发展起来的具有鲜明跨学科色彩的应用研究领域。1.1.1 海盆数据的分析需求催生数据挖掘20世纪80年代以来,随着计算机数据库技术和产品的日益成熟以及计算机应用的普及和深化,各行业部门的数据采集能力得到了前所未有的提高。各组织通过其内部的业务处理系统、管理信息系统以及外部网络系统,获得并积累了浩如烟海的数据。

编辑推荐

《基于Clementine的数据挖掘》适合于从事数据分析的各应用领域的读者,尤其适合于商业销售、财会金融、证券保险、经济管理、社会研究、人文教育等行业的相关人员。同时,也能够作为高等院校计算机类、财经类、管理类专业本科生和研究生的数据挖掘教材。

图书封面

图书标签Tags

评论、评分、阅读与下载


    基于Clementine的数据挖掘 PDF格式下载


用户评论 (总计26条)

 
 

  •   很实用的教材,现在正在学习,学统计的一定要会
  •   一直在找SPSS关于Modeler方面的应用书籍,网上都没有,今天看图书推荐,总算找到了,一看出版时间也是刚出版的,觉得是自己要找的那本书,很不错,推荐给朋友
  •   对我写论文很有帮助,支持向量机的应用应该是现在挺新的一个内容
  •   书内有详细的操作过程,不错。
  •   讲解很细致,不错,适合初学者
  •   书应该很不错,因为是我们上课的参考书,刚买回来,具体内容还没有看,但是质量确实不错,而且发货的时间很准确,很好!
  •   非常有用,也很好懂,很好学
  •   快递速度很快,书很不错。
  •   实用,正在看,相信会有收获的
  •   专业课的书~很好
  •   正版不用说,书还不错
  •   看了几页,很详细,并且易懂,比科学出版社的书强多了
  •   还不错的一本书,傻瓜式操作,要是想搞清各种数据挖掘算法原理的话,不推荐这本书。
  •   主要是Clementine各个节点的中文使用说明,附带一些案例,比较适合有一定统计学基础,而又是刚刚接触Clementine的人
  •   老师推荐的参考书,如果没人教的话,用这本书自学很不错的。
  •   很实用的一本书,先看看
  •   简单翻了下,感觉基本上还行,在对应网站上提供了教材的例子数据
  •   先是网上找不到数据,然后终于上传数据了,只有通过教师资格才能下载,可是书里前言部分压根没说。额,没诚信。没有数据怎么练习?
  •   可以用了,其他的就不用想了
  •   还不错,但是老版本的clementine和现在的版本还确实是有些差别
  •   这本书很好 很值得拥有 亚马逊的快递也很给力
  •   比较详细,适合入门,很不错
  •   告诉你spss的基本使用,感觉有点象说明书的翻译,还算详细
  •   有实例,有数据可供学习演练
  •   有理论有操作演示,非常好的入门书!
  •   书的质量不错,亚马逊送货人员的态度非常好,希望以后不要用其他的快递公司,尤其是小红帽
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7