数据可视化:柱状图、雷达图等六种基本图表得特点与适用场合2 014-11-30 数据挖掘与数据分析“数据可视化”可以帮助用户理解数据,一直就是热门方向。图表就是”数据可视化”得常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。用户非常熟悉这些图表,但假如被问道,它们得特点就是什么,最适用怎样得场合(数据集)?恐怕答得上来得人就不多了。本文就是电子书《Da ta Visual i zati o n w ith Ja v aScri p t》第一章得笔记,总结了六种基本图表得特点与适用场合,非常好地回答了上面得问题。序言进入正题之前,先纠正一种误解。有人觉得,基本图表太简单、太原始,不高端,不大气,因此追求更复杂得图表。但就是,越简单得图表,越容易理解,而快速易懂地理解数据,不正就是”数据可视化”得最重要目得与最高追求吗?所以,请不要小瞧这些基本图表。因为用户最熟悉它们,所以只要就是适用得场合,就应该考虑优先使用。一、柱状图(Bar C ha r t)柱状图就是最常见得图表,也最容易解读。它得适用场合就是二维数据集(每个数据点包括两个值 x 与y),但只有一个维度需要比较。年销售额就就是二维数据,”年份”与”销售额”就就是它得两个维度,但只需要比较”销售额”这一个维度。柱状图利用柱子得高度,反映数据得差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图得局限在于只适用中小规模得数据集。通常来说,柱状图得 X 轴就是时间维,用户习惯性认为存在时间趋势。假如遇到X轴不就是时间维得情况,建议用颜色区分每根柱子,改变用户对时间趋势得关注。上图就是英国足球联赛某个年度各队得赢球场数,X 轴代表不同球队,Y 轴代表赢球数。二、折线图(L i n e C hart)数据折线图适合二维得大数据集,尤其就是那些趋势比单个数据点更重要得场合。它还适合多个二维数据集得比较。上图就是两个二维数据集(大气中二氧化碳浓度,地表平均气温)得折线图。三、饼图(P ie Ch art)饼图就是一种应该避开使用得图表,因为肉眼对面积大小不敏感。ﻫ上图中,左侧饼图得五个色块得面积排序,不容易瞧出来。换成柱状图,就容易多了。一般情况下,总就是应该用柱状图替代饼图。但就是有一个例外,就就是反映某个部分占整体得比重,比如贫穷人口占总人口得百分比。四、散点图(S c at te r Ch a r t)散点图适用于三维数据集,但其中只有两维需要比较。上图就是各国得医疗支出与预期寿命,三个维度分别为国家、医...