本
文
摘
要
我们经常能遇到诸如排名,还有比较数据不同变量之间关系等场景,同一项排名或许可以用柱状图,但是如何体现排名的波动呢?除了折线图之外,还有没有别的选择?一组数据的分布可以用直方图,两组数据之间的关系可以用散点图,三组数据可以用气泡图,那四组、五组数据该怎么办?今天,我们介绍的平行线图,就是要帮你解决这些问题!
考虑多轴线排序 探索多变量关系
图片来源:平行坐标图- datavizcatalogue平行线图(Parallel Coordinates Plots/ Parallel Coordinates)是一个可视化高维、多变量数据的图表,最适合呈现数据的多种变量和可视化它们之间的关系,并且方便读者一次性进行多变量的对比。
图片来源:平行线图- datavizcatalogue在平行线图中,每个变量都有自己的轴线,所有轴线彼此平行放置,各自可有不同的刻度和测量单位,一系列的直线穿越所有轴线来表示不同数值。
另外,虽然轴线排列没有固定的顺序,但是因为相邻变量会比非相邻的变量更容易进行比较,所以轴线排列的顺序可能会影响读者理解数据。可见,轴线的顺序会影响读者对于不同变量之间的关系的把握,因此,在可视化过程中,各轴线的顺序则成为需要“下功夫”的部分。
平行线图制图工具:
镝数图表-在线动态图表工具-零代码数据大屏可视化dycharts.com/appv2/#/pages/home/index?channelCode=55DGOK5B&hmsr=zh-dycharts-article&hmpl=pid-485849119先有图 再有名
“平行线”这个名词最早出现在1885年Philbert Maurice dOcagne的书里面,书中提到了“Coordonnées parallèles”这个名词,但是和我们今天讲的平行线图根本不是一回事。
平行线图的出现要比这个名词早很多。在1880年,Henry Gannetts在《总结并展示国家等级》(General Summary, Showing the Rank of States, by Ratios)一图中,就运用了平行线图,从人口、就业、财富、制造业、文化、教育等10个维度来对各个国家进行排名。
General Summary, Showing the Rank of State *** y Ratios , Henry Gannetts从右数的第三、第二个维度分别是税收和教育支出,从线的X型分布情况来看,一般税收高的国家,人民的基础教育支出比较少。
但是这些线条非常密集,很难看清排名的一一变化。针对这个情况,现在,我们除了可以用交互方式解决,或者用颜色突出特定的国家之外,还能用一种叫做“Brushing”的方法应对,文章后面会提到。
在1898年,Henry Gannetts再次利用平行线图,可视化了在美国1790至1890年的人口普查中,各州/地区的人口排名。其中,每一列代表一年,一个方块代表一个州/地区,作者还用了纹理强化了州/地区。由于历史原因,很多1790年存在的地方被合并,因此州/地区的数量不断在改变。
Rank of States and Territories in Population at Each Census1790-1890后来,Inselberg Alfred把平行线运用在算法的可视化上,自1985年起,平行线图的运用拓展到数据挖掘、计算机视觉、空中交通管制防撞算法等领域上面。
PARALLEL COORDINATES : VISUAL Multidimensional Geometry and its Applications“排名”话题最常用的可视化
一般来说,媒体较常用平行线图可视化有关“排名”的话题。
Millward Brown每年都会总结全球范围内最具价值的品牌,Valerio Pellegrini根据2010至2015年的前100位品牌的排名变化,利用平行线图进行可视化。
100 MOST VALUABLE BRANDS 2010-15从整体的情况来看,前4的公司——谷歌、IBM、苹果、微软的排名都比较稳定,变动不大,而处于中下的公司,每年的排名波动则比较大。从细节来看,平行坐标图能够帮助我们看到每家公司的排名是升还是降。
下面的平行线图也是对1990至2013年,全球移民目的地和来源地的排名进行了可视化。
《全球移民路线图:美国为移民首选目的地》网易数读以上两个平行线图的变量都是具有相同的测量单位,且数据量比较少。
这个平行 *** 图则是基于App Store中评论超过10条的应用数据,展示了评分、浏览量、关键词数量、总下载量、价格这5个维度的数据。从线条的分布和密集程度,我们可以看到这些应用的下载量都集中在100万-1000万之间,且大部分都是免费的。
图片来源:mobileorchard.com平行线图的缺点是,当数据密集时,图表容易变得混乱,线条难以辨认。解决这个问题的最好办法是通过一种名为“Brushing”的技术。“The Brushing of Sample”是在统计图形的交互技术中常使用的一种技术,一开始是为了在散点图中,屏蔽和隔离偏离的数据点而引入的。
基于数据和一定的算法,“Brushing”帮助过滤干扰数据。在进行处理后,我们可以根据更为集中的数据,用颜色进行强化,同时淡化所有其他线条,让我们能更集中研究感兴趣的部分,并滤除干扰数据。
就像下图,通过筛选干扰信息之后,数据分布更为集中,如果给线条的密度编码,赋予不同的颜色,我们能更容易把握数据之间的关系。
State of the Art of Parallel CoordinatesJ. Heinrich and D. Weiskopf另外,在平行线图里,各轴的单位一般是不相同的,所以不能进行跨轴的数据比较。但是在上文提到的关于不同年份的排名时,由于是对相同变量的可视化,所以可以进行跨轴比较。因而,在读图时,我们要注意各轴的测量单位。
赶快登录镝数图表!简单的操作和精美界面,给你非凡的制图体验,仅需复制粘贴数据就可以制作同款平行线图,超多惊喜,就等你来!
镝数图表-在线动态图表工具-零代码数据大屏可视化dycharts.com/appv2/#/pages/home/index?channelCode=55DGOK5B&hmsr=zh-dycharts-article&hmpl=pid-485849119