当前位置:首页 » 机器学习电子书 » 正文

图灵程序设计丛书•鲜活的数据:数据可视化指南 - 电子书下载(高清版PDF格式+EPUB格式)

1550 人参与  2018年12月17日 23:50  分类 : 机器学习电子书  评论

图灵程序设计丛书•鲜活的数据_数据可视化指南-邱 (Nathan Yau)

            在线阅读                   百度网盘下载(o3hg)


image.png

书名:图灵程序设计丛书•鲜活的数据:数据可视化指南

作者:邱 (Nathan Yau)

格式:EPUB, HTMLZ, PDF

路径:点击打开

出版:人民邮电出版社

排序作者:邱 (Nathan Yau)

排序书名:图灵程序设计丛书•鲜活的数据:数据可视化指南

日期:09 12月 2018

uuid:3a25e891-baa2-4c4b-8db2-2aa4e8307eab

id:513

出版日期:10月 2012

修改日期:09 12月 2018

大小:41.86MB

语言:中文

第1章 用数据讲故事

让我们先回想一下过去曾看到过的那些数据可视化作品——听演讲时看到的幻灯片、博客文章的配图以及此刻在你脑海中浮现的经典案例。它们的共同点是什么?它们都在讲故事,有趣的故事。这些故事也许是为了让你相信某件事情,或者呼吁你做出某种举动,也可能是通过新的信息激发新思路,或者是打破早已形成的先入之见。不管它们的意图是什么,各种尺寸和形式的优秀数据可视化作品都在帮助我们理解数据背后的意义。

第2章 处理数据

在我们开始视觉化之前,首先需要有数据。正是数据让可视化有趣起来。如果数据本身没有意思,就只能是一张好看但无用的图片而已,很快就会被人丢在脑后。那么在哪里才能找到好的数据?又怎样去获得它呢?

在拿到了数据之后,我们还需要对它们进行格式化,以便输入到软件中去。你得到的可能是以逗号分隔的文本文件,或者Excel电子表格,而你需要将它们转换成像XML这样的语言。或者反之亦然:也许原始的零散数据来自于某个网页应用,但你需要的是一份完整的电子表格。

首先学会如何获得数据和处理数据,然后再提高我们的可视化技能。

第3章 选择可视化工具

在上一章中,我们了解了去哪里找到数据,以及如何将数据设置为自己需要的格式。现在让我们看看可视化方面。关于这一点,人们最常问的问题是“我应该用什么软件来对数据可视化?”

幸运的是,我们有很多选择。有些软件是开箱即用的(out-of-the-box),只需要鼠标就能操作,还有些软件则需要一点编程技巧。虽然有些工具并非专门用于制作数据图,但依然很有帮助。它们在本章中都会有所提及。

掌握或了解的可视化工具多了之后,面对数据时就不会束手无策,创作出你想要的数据图也会更加容易。

第4章 有关时间趋势的可视化

时间序列数据无处不在。舆论在变化,人口在迁移,企业在发展。我们通过时间序列数据来观察这些事物是如何变化的。本章会分别讨论离散时间和延续时间的数据,因为不同的数据类型决定了图表的表现形式。我们还会亲身体验R和Adobe Illustrator的强大功能——结合使用这两款软件实现的效果简直太棒了。

第5章 有关比例的可视化

时间序列数据自然是以时间为分组依据的。它显示了在某个特定时间范围内发生的一系列事件。在比例数据中同样也存在分组依据,只不过它是按类别、子类别和群体进行划分的。这里的群体并不仅指人类群体,它代表的是各种可能的选择或产出,也就是样本空间(sample space)。

问卷调查可能会询问人们对某个问题是赞同、反对还是保持中立。每一个观点类别都有各自的意义,而且各部分加起来构成了整体。

本章讨论如何表现单个的类别,并提供了更广阔的视野——各个选择之间如何相互关联。你会用到之前章节中学到的工具,还会首次尝试用HTML、CSS和JavaScript创建可交互的图表,并接触到用Flash创建的图表。

第6章 有关关系的可视化

统计学就是要寻找数据之间的关系。两个群体彼此之间存在哪些共同点?群体内部的子群体之间有哪些共同点?子群体内部的个体之间又有哪些共同点?对于统计来说,人们最熟悉的关系就是关联性(correlation)。比方说,如果全民的平均身高增高了,那么平均体重自然也会随之增长。这是一种简单的、成正比的关联性。然而就和现实生活中一样,一旦我们开始考虑更多因素,或者试图寻找非线性的模式,那么数据间的关系就会变得更加复杂。本章讨论的是如何利用可视化的方法挖掘出并强调这些关系,从而讲出好故事。

在本章和下一章中,我们开始处理更加复杂的统计图表。你会发现R能带来极大的帮助,而这些地方正是这一开源软件的强大之处。和之前一样,R包揽了最基础、最繁重的工作,而Illustrator则能让生成的图表更加易读。

第7章 发现差异

体育评论员喜欢把少数运动员捧为超级明星,或者认为其高人一等,而把其他运动员视为平均水平或角色球员。这种分类一般并不是来自于统计数据,而是来自他们看过的大量比赛。这是种“我看即我识”的心理,并非满嘴跑火车。评论员(往往)都知道自己在说些什么,通常也会考虑到数据的上下文背景。每当体育分析员查看运动员的表现数据时,必定会有人提到:“你不能只看表面的数据。正是这种不确定性让赛事变得如此美妙。”这就是统计学的魅力所在。

很明显不只是体育界才这样。也许你希望找到街区最好的餐馆,或者找出谁是店里最忠实的顾客。在这种情况下,你也许不会去为个体进行分类,而是寻找那些从同类中脱颖而出的人或事。本章将讲述如何从全体中找出满足多种标准的集合,以及利用常识找出异常值。

第8章 有关空间关系的可视化

地图是一种非常直观的可视化类型。我在还是个孩子的时候就能看懂地图。我还记得当时坐在父亲车里的副驾驶位置上,打开巨大的地图大声为他指路。如今这个角色已经变成了一位澳大利亚女士,从仪表盘的一个小盒子里用平缓而机械的声音迸出应该前进的方向。

不论怎样,地图都是一种理解数据的极佳手段。它们是真实世界按比例缩小后的版本,而且它们无处不在。在本章中,我们会深入到多种空间数据集中,寻找跨越空间和时间的那些模式。我们会先用R创建一些基础地图,然后用Python和SVG创建更高级的地图,最后,用ActionScript和Flash来创建可交互的动画地图。

第9章 有目的地设计

当我们探索自己的数据时,没必要关心太多讲故事的条条框框,毕竟我们自己就是讲故事的人。不过,在使用图表来展示信息时,不管对象是一个人、数千人还是上百万人,单单一幅图表很可能是不够的。

毫无疑问,我们希望其他人能理解我们得出的结果,说不定还能从中发展出他们自己的故事。但是,读者在刚刚拿到数据时很难知道应该关心哪些问题。降低门槛是我们的责任和义务。我们如何设计图表将直接影响到读者如何理解数据。

来源:我是码农,转载请保留出处和链接!

本文链接:http://www.54manong.com/?id=1184

机器学电子书  

微信号:qq444848023    QQ号:444848023

加入【我是码农】QQ群:864689844(加群验证:我是码农)

<< 上一篇 下一篇 >>

网站分类

标签列表

最近发表

全站首页 | 数据结构 | 区块链| 大数据 | 机器学习 | 物联网和云计算 | 面试笔试

本站资源大部分来自互联网,版权归原作者所有!