可视化数据

出版时间:2009 年  出版社:电子工业出版社  作者:Ben Fry  页数:366  字数:470000  译者:张羽  
Tag标签:无  

前言

  《可视化数据》是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,本书都给出了非常详尽的介绍。本书使用由作者开发的开源编程环境Processmg编程,它非常简单易用。对于熟悉使用Java的程序员来说,本书后面的章节还介绍了如何将Processing和Java结合起来使用。  “细致”是本书的特点之一。作者详细地从一组数字开始,一步一步地举例讲述如何生成最终的具有交互功能的图形或软件。在此引用亚马逊网站上一位读者对本书的书评,“《可视化数据》的最可贵之处是它还是一本真正的‘设计’书籍,书中对于颜色、排版和交互‘体验’的使用都是经过深思熟虑的。Fry的数据可视化方法是值得出现在任何一本EdwardTufte书籍里面的。当我在一段代码注释中间看到Fry写了几段关于为什么破折号和非线性数字会使得某个特定的示例看上去更好的原因之解释时,我几乎高兴得要跳起来。这种细致的程度,我认为,在其他书籍上是很难看到的。”市场上鲜见如此详细的与数据可视化相关的书籍,《可视化数据》以作者亲身实践为基础,从零开始手把手帮助读者学习创建数据的可视化步骤,正好填补了这一空白,是学习可视化数据不可或缺的宝贵资源。  同时,本书的适用读者对象十分广泛。无论是对于缺乏技术背景的美术设计专业的学生,还是对编写程序一无所知的初学者,以及那些有着高级编程背景的工程技术人员,本书都具有同样的指导和参考意义。即使在数据信息学其他领域(如数据挖掘等),本书中的许多概念和方法仍然可以被借鉴和使用。  借此机会,我要特别感谢韩宇先生和习平女士对本书所做的编辑、整理和检查工作。他们的辛苦努力是保证本书翻译质量的关键。另外,还要感谢孙勇先生在翻译过程中提供的宝贵建议。此外,我还要感谢我的父母,他们的支持永远是我前进的动力。由于翻译进度要求较高,加之本人翻译水平有限,书中难免有疏漏或错误,衷心地欢迎广大读者批评指正。

内容概要

   本书是一本关于计算信息设计的书籍。从如何获取原始数据开始,到如何理解原始数据,本书都给出了非常详尽的介绍。本书使用由作者开发的开源编程环境Processing编程,它非常简单易用。对于熟悉使用Java的程序员来说,本书后面的章节还介绍了如何将Processing和Java结合使用。    本书是写给那些拥有一个数据集合,好奇如何探索它,并且考虑如何交流这些数据的人们的。随着我们处理越来越多的信息,需要可视化数据的人们的数量增长的非常迅速。更重要的是,读者已经超越了某些可视化领域的专家。通过让更大范围的人们都接触到可视化思想,我们在接下来的几十年中应该可以看到一些真正让人惊叹的成果。

作者简介

(美)弗莱(Ben Fry),在麻省理工多媒体实验室Aesthetics+Computation Group获得了博士学位,他是卡内基.梅隆设计学院2006~2007年度Nierenberg Chair of Design的客座教授。他同Casey Reas共同开发TProcessing,并在2005年荣获TPrix Ars Hectmnica的Gloden Nica奖项。Ben的

书籍目录

前言第1章 可视化数据的七个阶段 1.1  为什么数据显示需要计划 1.2 一个例子 1.3 相互影响和联合 1.4  原则 1.5  综述第2章 Processing入门  2.1 Processing的草图功能  2.2 导出和发布你的项目  2.3 示例和参考  2.4 函数  2.5 草图和脚本编程  2.6 准备好了吗?第3章 映射  3.1 绘制一幅地图  3.2 地图上的定位  3.3 地图上的数据  3.4 使用你自己的数据  3.5 下面的步骤第4章 时间序列 4.1 牛奶、茶和咖啡(获取和分析) 4.2 清理桌子(过滤和挖掘) 4,3 一个简单的图表(表述和修饰) 4.4 为当前数据集合贴上标签(修饰和交互) 4.5 绘制坐标轴(修饰) 4.6 选择一个合适的表述(表述和修饰) 4.7 通过鼠标滚动强调数据点(交互) 4.8 连接数据的方法(修饰) 4.9 标签面板一样的文本标签(交互) 4.10 数据集合之间插值(交互) 4.11 结束时间序列第5章 连接和关连  5.1 改变数据源  5.2 问题描述  5.3 预处理  5.4 使用预处理过的数据(获取,分析,过滤,挖掘)  5.5 显示结果(表述)  5.6 回到问题本身(修饰)  5.7 复杂排序:将收入作为判断胜局的依据  5.8 转移到多个日期(交互)  5.9 平滑交互(修饰)  5.10 实施时的考虑因素(获取,分析,过滤)喜6章 散点地图 6.1 预处理 6.2 载入数据(获取和分析) 6.3 用邮政编码绘制散点图  (挖掘和表述) 6.4 在输入的时候突出显示  (优化和交互) 6.5 显示目前已选择的点(优化) 6.6 逐渐地将点变暗和变亮(优化) 6.7 放大(交互) 6.8 改变缩放时的点的画法(优化) 6.9 部署的问题(获取和优化) 6.10 下面的步骤第7章 树、层次结构和递归第8章 网络和图第9章 获取数据第10章 分析数据第11章 结合processing和Java参考书目索引

章节摘录

  第1章 可视化数据的七个阶段  1.1 为什么数据显示需要计划  每一组数据有其特殊的显示需要,为了这些需要,你使用这些数据集合所产生的作用和数据本身一样多。在办公应用程序,网络上和其他地方有很多快速图形开发工具,但是在特殊应用程序使用的复杂数据集合需要特殊处理。通过本书,我们将讨论数据集合的特性将如何帮助你选择须要使用的可视化类型。  1.1.1 过量信息  当听到“信息过载”这个词的时候,你可能会很准确地理解它的意思,因为每天都在和它打交道。在Richard Saul Wurman的新书Information Anxiety(Doubleday信息焦虑)中,他描述了《纽约时报》周日版所包含的信息如何比一个处于文艺复兴时期的人一生所接触的信息还要多。但是这是一个令人振奋的年代。你可以用$300就买到一个PC商品,其计算能力比第一个制作美国人口普查表的计算机的计算能力要高出上千倍。现代计算机的计算能力实在令人惊叹。进行复杂数据分析不再需要一个研究实验室,仅需要一台便宜的机器和一些代码。大众对复杂数据集合的存取、研究和分析都能以一种简单的方式实现,这在过去是不可能的事情。过去l0年中,普通机器的图形化能力也有大幅度提高。在游戏产业的带动下,高端的2D和3D图形硬件不再需要特殊厂商提供的固定机型,而只花$100买到一张附加卡作为替代,这些硬件成为适合于任何一台机器的标准设备,其花费大概是$700或再高一点。当这些卡不再用于游戏的时候,它们可以用于渲染极其复杂的模型,里面包含上千种图形,而且也能非常快速地制作流畅交互的动画。它们的价格会跟随年头逐渐降低,加速图形卡会成为上述PC商品上的一个标准设备。

媒体关注与评论

  “通过现代数据图形大师的这本非常详细的向导书籍,您可以了解从零开始可视化数据编程的所有细节。阅读此书,你将不再依赖于别人对你数据的观点。”    ——Martin Wattenberg《Map of the Market》和《Baby Name Voyaer》的作者

编辑推荐

  如今绝大多数的数据都变得难以利用,仅仅因为人们无法可视化其中的数量与关系。《可视化数据》使用了一种流行的、开源的由作者开发的编程环境Processing,并说明了准确地在网页上或别处表述数据的方法,实现了用户交互、动画和更多功能。如何将30亿人的基因同猩猩或是老鼠的基因相比较·数百万网民通过什么样的途径来访问同一个网页·通过《可视化数据》,可以学习使用交互显示来回答类似的复杂问题。我们不是谈论统一的图表模板。《可视化数据》指导您如何在Processing的帮助下,为一个庞大的、复杂的数据集合设计整个接口,Processing是一个强大的设计工具和编程环境。许多研究人员和公司都使用Processing,它以一种清晰易懂的方式来表达具体数据。通过这个工具和《可视化数据》,您可以学习基本的可视化原则,以及如何选择合适的显示,如何提供交互功能,为您的网站不断地带来更多的用户。  《可视化数据》内容包括:  ·可视化数据的七个阶段:获取、分析、过滤、挖掘、表述、修饰和交互;  ·数据问题是如何开始的,又是如何以一个清晰的答案结束的,通常还附有额外的细节;  ·许多项目实例的实现;  ·每种表述方式的优缺点,这些表述方式是以定制为中心的,这样它们能更好地表达它们要表示的数据集合。

图书封面

图书标签Tags

评论、评分、阅读与下载


    可视化数据 PDF格式下载


用户评论 (总计18条)

 
 

  •   数据可视化,Processing实践项目,包含有Processing和java结合部分
  •   数据可视化最佳入门书籍,超级经典!
  •   质量好 内容丰富 O'Reilly的书果然没有让我失望
  •   整体还行,比较细致而简要的讲述了可视化的概念
  •   它可以增长你的学习面
  •   项目组买的书,不过买完发现,没太有用,可能跟我们的项目关系不太大吧 不过书的质量还是不错的
  •     “下面的代码是从namces.tsv文件读入的,并且通过在用户要放置数据的地方点击鼠标,要求用户指明地址。”
      
      “从这个例子开始作为一个独立的sketch程序。”
      
      坑爹的翻译坑爹的校对坑爹的出版社
      
      强烈建议O'Reilly不要费力找坑爹的中国出版社翻译中文版,完全是败坏O'Reilly形象,直接出影印版好了。
  •     书名起的有诱导的嫌疑。英文书名则明确说明本书是数据可视化工具Processing的使用详解。本书专门讲解数据可视化工具processing的使用。有许多代码示例。感兴趣的可以先下载Processing看看,需要深入的话再买这本书细读。
  •     题目起的不厚道。英文书名则明确说明本书是数据可视化工具Processing的使用详解。本书专门讲解数据可视化工具processing的使用。有许多代码示例。感兴趣的可以先下载Processing看看,需要深入的话再买这本书细读。
  •     定价65的书,翻译居然这么差。。只看了前两章,且从第二章发现句子很奇怪之后才开始对照英文看,这么短的篇章就错误连篇得足以让我放弃继续阅读中译本了。
      抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了
  •     刚开始看,还颇有些兴趣。因为他着重讲到一个思想。明确需求,再去重新过滤数据。以前,竟想到怎么去匹配,挖掘数据了。看到他做的地图,感觉也不错。
      后来,看着看着,有点枯燥,感觉在自己的工作过程中,用处并不是很大,毕竟,自己不会为展示数据,而花时间开发一个可视化的项目。而且,后来提到的“视觉化软件工程”,感觉,也当成是一个大的项目去设计,完成,并不是我当初以为的,能够取代excel的工具。
      
      暂时看到第二章,后面就是processing工具的编程,基本是也是java编程。感觉是和awt,swing那些差不多。
      以后结合着需要,再慢慢看吧,就不花费时间了。
  •     在这个到处都是信息的时代,我们无论主动被动都会时不时接收到若干的数据集合,如何理解这些数据往往依赖于接收者的知识技能背景,但是这个不是非常重要,因为好奇心总是会驱使着人们去尝试些有挑战性的工作。于是“数据可视化”正逐渐成了越来越多的人理解、交流获取到的数据集的一个必不可少的过程。
      
      正是基于以上原因,我开始看《Visualizing Data》这本书,尽管我的候选方向不包括“计算信息设计(Computational Information Design)”。如你所见,我的知识背景是程序设计,跟艺术没有关系,这便是我想澄清的一点,关于“数据可视化思维”。由于“数据可视化”多少涉及到一些图形图像方面的知识,于是有人认为这应该由艺术系的人去搞,至少搞这个需要艺术细胞,他们可能还会再给出一些诸如“没有艺术细胞,即使会操作 PhotoShop也很难作出优秀的图”之类的理由。但我想说得是,这个完全是两个抽象层次的概念,互相促进又互相正交:“数据可视化”的核心是how“ 可视化”,而所谓需要艺术细胞的那些活则是“可视化”what,所以“数据可视化”一样需要计算机方面的知识,甚至可能还需要计算机图形学乃至数学知识, 是不还需要“计算机逻辑细胞”?!
      
      罗嗦了一大堆,该回到主题上了。之所以会出现此文,是因为我感觉《Visualizing Data》还是有些让人不尽人意的地方。比如,作者使用的教学语言是他自己发明的processing, 这一简单的编程环境和API,之所以不选通用语言如python,java等,我猜原因就是上面分析中涉及的,读者的知识背景比较多样,不一定都具有编程 基础。但是,不得不说……基于java的本地gui程序在我的linux系统上一直表现极差,比如本书相当于的“hello world”例子就总是让我死机,因此对java产生偏见了(要知道java也是我曾经最喜欢的语言之一),所以……我删了processing。转而选了flash/air/actionscript3.0,这个号称在图形前端表现开发上处于领先地位的编程语言(当然这个是我的老本行,尽管以前很少使用图形api);另一方面,虽然本书对如何获取、理解数据都介绍的比较详尽,但是在how编程这点上让我云里雾里的,这个大概是因为processing本身是带了源码的,看源码就能一目了然的缘故吧,总之没有考察这点。而且语言之间多少有点差异,况且flash的普及度更高一点,一方面自己按照要求全部实现本身就是一个很好的学习过程,一方面刚好可以和大家分享。
      
      所以本系列文章就按章节分享书中实例的AIR1.5/ActionScript3.0实现。当然,我并不想原封不动的翻译processing代码,而且与“可视化”这个目的没有直接关系的部分也不予细究,比如如何生成随机数等。这里跟大家说声抱歉,毕竟这个学习过程在我的方向上只是一个支线。在具体的文章里,与书中代码差异交大的部分我会特别说明的,而且我的as3代码可能没有注释,因为代码本身就很容易理解(不考虑我们所喜欢的代码风格差异)。
      
      最后简单概况一下“可视化数据”的七个步骤:
      1.获取数据,无所谓是来自文件、磁盘亦或是网络等;
      2.分析数据结构,分类排序;
      3.过滤,去掉所有不感兴趣的数据;
      4.综合使用数学、统计、模式识别等等方法来挖掘出一些特征数据;
      5.选择诸如棒图、列表、树等的可视化模型来描绘数据;
      6.精炼基本表示法,使数据描绘的更清楚,更具视觉效果;
      7.添加一些用于控制或操作数据的交互方法。
      
      http://wargrey.yo2.cn/go/36160.html
  •   “编程母语”这个词,用得太好了
    极度怀念小学用LOGO写一棵小树的说..
    写的赞
  •   赞 LZ费心了
  •   你的这个书评最好注解为: 一个计算机专业背景对书的理解.
  •   Okay
  •   呵呵,不就一排版图像的LaTeX嘛,看被你说的...
    不过,作者对数据处理的七个步骤确实归纳地很准确。
  •   说白了,这本书是Ben Fry为了自己开发的Processing所推出的一本使用指南手册,放在网上免费读感觉可惜,写一些自己的方法论,配合自己开发的api包,给O'Reilly出版卖钱。Processing有一段时间比较火,也促成了此书的出版。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7