精品文档---下载后可任意编辑2024-11-30 数据挖掘与数据分析“数据可视化”可以帮助用户理解数据,一直是热门方向
图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用
用户非常熟悉这些图表,但假如被问道,它们的特点是什么,最适用怎样的场合(数据集)
恐怕答得上来的人就不多了
本文是电子书《Data Visualization with JavaScript》第一章的笔记,总结了六种基本图表的特点和适用场合,非常好地回答了上面的问题
序言进入正题之前,先纠正一种误解
有人觉得,基本图表太简单、太原始,不高端,不大气,因此追求更复杂的图表
但是,越简单的图表,越容易理解,而快速易懂地理解数据,不正是”数据可视化”的最重要目的和最高追求吗
所以,请不要小看这些基本图表
因为用户最熟悉它们,所以只要是适用的场合,就应该考虑优先使用
一、柱状图(Bar Chart)柱状图是最常见的图表,也最容易解读
精品文档---下载后可任意编辑它的适用场合是二维数据集(每个数据点包括两个值 x 和 y),但只有一个维度需要比较
年销售额就是二维数据,”年份”和”销售额”就是它的两个维度,但只需要比较”销售额”这一个维度
柱状图利用柱子的高度,反映数据的差异
肉眼对高度差异很敏感,辨识效果非常好
柱状图的局限在于只适用中小规模的数据集
通常来说,柱状图的 X 轴是时间维,用户习惯性认为存在时间趋势
假如遇到 X 轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注
上图是英国足球联赛某个年度各队的赢球场数,X 轴代表不同球队,Y 轴代表赢球数
二、折线图(Line Chart)数据折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合
精品文档---下载后可任意编辑它还适合多个二维数据集的比较
上图是两个二维数据集(大气中二氧化碳