找回密码
 立即注册
首页 业界区 安全 读用数据说服:如何设计、呈现和捍卫你的数据01数据图 ...

读用数据说服:如何设计、呈现和捍卫你的数据01数据图

桂册 10 小时前
1.png

1. 挑战

1.1. 多元认知的挑战

  • 1.1.1. 注意力集中在第一个出现的念头上

    • 1.1.1.1. 这个观察自身思维的过程叫作元认知
    • 1.1.1.2. 它是学习掌握解码过程的一项重要技能

  • 1.1.2. 编码是一个大脑的事,意图清晰,而解码是多个大脑的事
  • 1.1.3. 为了实现高效沟通,你需要理解这些因素,培养对受众差异化需求的敏感度
  • 1.1.4. 前提是,受众的想法未必与你一致

    • 1.1.4.1. 如果你想要多个人按照你的意图解码数据,那就需要数据设计、数据结构和数据呈现

1.2. 知识的诅咒

  • 1.2.1. 当一个新想法出现时,我们会以惊人的速度对其进行评估
  • 1.2.2. 如果它看上去熟悉,也没有迹象表明需要进一步探察,我们一般就会认可它,并将其纳入自己对世界的认识中
  • 1.2.3. 一旦它获得了认可

    • 1.2.3.1. 我们会忘记这个想法出现之前的生活是什么样子

  • 1.2.4. 这个古老的魔咒就是知识的诅咒

    • 1.2.4.1. 当你学会了一件事,你就会忘记不知道这件事是什么样
    • 1.2.4.2. 你甚至会忘记它曾经对你来说是新信息
    • 1.2.4.3. 大脑不允许我们回到习得知识之前的状态

  • 1.2.5. 知识的诅咒有大量证据支持

    • 1.2.5.1. 我们不仅会因此忘记不知道一件事是什么样,甚至会忘记它曾经是新信息
    • 1.2.5.2. 知识越多,诅咒就越强
      1.2.5.2.1. 相比于新手,专家受到的影响一般更大


  • 1.2.6. 破解知识的诅咒,是数据沟通的首要挑战之一
1.3. 认知负荷

  • 1.3.1. 我们的大脑喜欢轻松,厌恶紧绷
  • 1.3.2. 一旦大脑认为我们理解了一件事,我们往往就会停止深入思考
  • 1.3.3. 作为人类,我们会避免认知负荷,尽可能保持心力

    • 1.3.3.1. 这是一个很强的效应,以至于我们更容易相信认知负荷较低的语句

  • 1.3.4. 对设计的第一个启示是,容易读懂的数据才令人信服
  • 1.3.5. 一个更普遍的启示是,数据沟通不是将你的思想扁平化,而是要去掉一切可能妨碍受众理解的东西,是运用设计手段来凸显你的思想,削弱外部噪声

    • 1.3.5.1. 事情应该力求简单,但不能过于简单。
      1.3.5.1.1. 阿尔伯特·爱因斯坦(Albert Einstein)


2. 了解自己的思想

2.1. 我们每天都会遭到海量数据轰炸,而我们的大脑原本并不适合处理这种体量的数据
2.2. 高效传递数据是利人善举

  • 2.2.1. 你帮助他人对世界有了更清晰的认知,对方就可以将精力聚焦于难点,争取做出好的决策
2.3. 在从原始数据到合理决策的道路上,人脑设置了诸多障碍
2.4. 数据可视化书籍大多只讲如何做好数据图

  • 2.4.1. 介绍如何利用数据图实现高效沟通,说服他人在数据指导下采取行动
2.5. 沟通是将想法编码成文字、图像和声音,再由他人解码的过程

  • 2.5.1. 沟通就是信息编码、传递和解码的过程
  • 2.5.2. 我们将大脑中的想法编码成声音、图像和文字的形式,以便传递给其他人
  • 2.5.3. 解码是发生在他人大脑中的相反过程
  • 2.5.4. 所有沟通难题也都来源于此
2.6. 要是数据沟通容易的话,那世界上就全是优质决策了
2.7. 两大传递渠道

  • 2.7.1. 视觉

    • 2.7.1.1. 通过视觉,可以将信息编码为图片、数据图或者你正在阅读的文字

  • 2.7.2. 听觉

    • 2.7.2.1. 可以将信息编码为声音,比如发言讲话
    • 2.7.2.2. 这些编码会以声波形式在空气中传播,最终被受众的耳朵接收

2.8. “向他人讲解数据”的思维模式

  • 2.8.1. 在你进行分析时,这三个挑战处于沉睡状态
  • 2.8.2. 只有当你启动沟通过程时,它们才会现身
  • 2.8.3. 除非你需要向多人沟通信息,否则就不需要担心多元认知差异
  • 2.8.4. 在你通过分析学到知识之前,知识的诅咒不会出现
  • 2.8.5. 认知负荷则是落在他人身上,你要求对方解码你的分析
  • 2.8.6. 要解决三大挑战,你需要切换到数据沟通的思维模式与技能,这与分析数据本身并不相同
  • 2.8.7. 搞清楚数据的意义是一回事,向其他人解释分析结果是另一回事

    • 2.8.7.1. 探索数据阶段和解释数据阶段
    • 2.8.7.2. 向他人解释数据与数据分析是两个独立的阶段,对思维模式与数据可视化有不同的要求

  • 2.8.8. 探索数据并进行可视化,目的是理解数据有什么含义,我们应当对数据提出什么问题,数据又能提供什么答案

    • 2.8.8.1. 探索是一个筛选数据的过程,就像沙里淘金一样,目的是寻找值得他人关注的金块
    • 2.8.8.2. 在探索数据阶段,高复杂度的数据图更有效率
    • 2.8.8.3. 数据图越复杂,你就能够同时评估更多的数据维度,更快提炼问题,更快找到答案

  • 2.8.9. 解释数据阶段

    • 2.8.9.1. 讲给别人听阶段
    • 2.8.9.2. 在这个阶段,你要把金块挑出来,然后打磨,让别人能轻松认出你发现的黄金
    • 2.8.9.3. 在解释数据阶段,复杂是大敌
      2.8.9.3.1. 受众需要迅速清晰地看到核心思想
      2.8.9.3.2. 过分复杂会让受众一头雾水,注意力偏离重点,还有喧宾夺主、引发误解的风险

    • 2.8.9.4. 如果你主动进入新的工作阶段,从分析转向沟通,那就能分散工作量
      2.8.9.4.1. 你原本要事后花力气说服和纠正别人,现在则是未雨绸缪,在实际沟通之前就预先筹备

    • 2.8.9.5. 直接带他们去看黄金,不要从头到尾逛一遍那些让你空手而归的地方

3. 了解数据图的原理

3.1. 数据图是数据沟通的一种关键工具
3.2. 数据图发挥威力的根源是,视觉加工系统很擅长发现视觉要素之间的关系

  • 3.2.1. 人类有能力处理所见物体的大小和位置
3.3. 人脑对上述视觉信息进行过滤,形成连贯图景的一种途径,就是将信息分块

  • 3.3.1. 闭上眼睛,你大概记不得你刚刚见过的所有事物的全貌
  • 3.3.2. 大脑记住的是信息块:凌乱的书桌、窗外的树、书架
  • 3.3.3. 高效数据图要对信息进行符合逻辑的分块处理,减轻受众的认知负荷
3.4. 大脑的另一种过滤方式是,聚焦于突出的或异样的事物

  • 3.4.1. 这种视觉性质叫作突出性
  • 3.4.2. 突出的视觉要素会留在脑海中
  • 3.4.3. 突出性是人脑限制认知负荷的一个例子
  • 3.4.4. 大脑几乎会瞬间发现图中要素之间的视觉关系,将信息分块,识别最突出的元素
3.5. 数据图利用了我们的一种超能力,那就是迅速且轻易地发现视觉关系

  • 3.5.1. 相比于表格,数据图更清晰便捷地体现了数据的关系
  • 3.5.2. 视觉化是数据探索中的一个关键步骤

    • 3.5.2.1. 数字计算是精确的,数据图是粗略的
    • 3.5.2.2. 绘制数据图是为了呈现关系
      3.5.2.2.1. 如果不呈现关系,数据图这个工具就没用
      3.5.2.2.2. 如果要呈现关系,受众理解数据图的速度和便利度可能会优于观看数据表


3.6. 大脑会将输入的信息分块

  • 3.6.1. 块可以是概念或符号的任意组合
  • 3.6.2. 块的划分标准是灵活的

    • 3.6.2.1. 几乎任何一组观念或意象都可以纳入一个块里,具体取决于我们内心的划分方式
    • 3.6.2.2. 一般来说,我们一次能够处理三到四个块

3.7. 发现最突出的要素

  • 3.7.1. 过滤信息的能力与发现关系的能力一样强大
  • 3.7.2. 人脑不会为进入眼睛的每一束光线赋予相同权重,而会聚焦于突出的部分
  • 3.7.3. 如果没有突出点,受众可能就无法聚焦于主要关系,理解关系的含义
  • 3.7.4. 要懂得突出性,确保受众将注意力放在正确的位置上,确保每一个解释性数据图都有一个最突出的点
  • 3.7.5. 我们的眼睛之所以会被突出元素吸引,是因为发现辨别视觉突出要素的认知负荷比较少

    • 3.7.5.1. 突出多个数字会消除这一效果
    • 3.7.5.2. 都突出,就都不突出了

  • 3.7.6. 要是将太多元素推到前台,受众的认知负荷就会加重,更难聚焦于任何一个元素

    • 3.7.6.1. 所有要素都突出的话,那就全都是噪声了

  • 3.7.7. 在知识诅咒的作用下,沟通者可能会对此视而不见

    • 3.7.7.1. 既然你已经知道了自己要找什么,那么,就算关键元素在受众看来并不突出,你还是会觉得它们很突出

  • 3.7.8. 虽然我们不能控制别人的眼球,但我们可以影响哪些元素更突出,更可能引来关注

    • 3.7.8.1. 高效的数据沟通者会有意识地选择突出元素,以便应对多元认知的挑战
    • 3.7.8.2. 会将受众从噪声上引开,引向有意义的模式
    • 3.7.8.3. 会认真和批判性地思考数据图的编码方式

3.8. 编码数据

  • 3.8.1. 高效数据图利用人类的视觉加工系统,通过呈现数据关系,将数据点整合成数量较少的几个块,并通过确保同一时间内只有一个块突出,让受众的注意力聚焦到这个块上
  • 3.8.2. 前注意加工

    • 3.8.2.1. 借助高效的数据图,受众得以在低认知负荷下快速处理复杂信息,因为数据图利用了我们在前注意加工阶段中识别出的特征
    • 3.8.2.2. 关于大脑对视觉元素的组合方式,则是由格式塔原理负责

3.9. 前注意特征是数据可视化的语法

  • 3.9.1. 大小是最常用的视觉编码

    • 3.9.1.1. 由于自然界里有对等物,所以大小是最直观的编码
      3.9.1.1.1. 树的高度、宽度和体积编码了年龄
      3.9.1.1.2. 树越大,可能就越老

    • 3.9.1.2. 任何数值都可以通过高度、宽度或面积来编码
      3.9.1.2.1. 高度一般是最容易用肉眼估测的,其次是宽度。至于面积差,受众就难以准确估计了,最多只能分辨出哪一块明显比另一块更大

    • 3.9.1.3. 柱形图的y轴要以0为原点
      3.9.1.3.1. y轴不以0为原点的做法叫作“截断y轴”​,常常用于歪曲数据
      3.9.1.3.2. y轴截断和误导性标题强化了错误的第一印象
      3.9.1.3.3. 如果微小差别是有意义的,可以考虑采用反向统计量


  • 3.9.2. 位置

    • 3.9.2.1. 折线图和散点图是最常用的位置编码形式
    • 3.9.2.2. 数值可以通过纵向位置或横向位置编码,也可以像散点图那种兼用两种位置
    • 3.9.2.3. 纵向位置高代表数值大
      3.9.2.3.1. 请记住,受众默认以上为好
      3.9.2.3.2. 上方通常代表数值大,而对于营业收入、利润、顾客数等重要经营指标来说,数值越大越好
      3.9.2.3.2.1. 受众一般会假定上好下差
      3.9.2.3.3. 除非一个指标是受众成天见到的,否则在他们充分把握数据之前,你都应当假定他们会将上解读为好
      3.9.2.3.3.1. 尽可能遵守这一规范,以减轻受众的认知负担
      3.9.2.3.4. 在上代表坏的情况下,比如获客成本,请明确标示该数据的特殊性


  • 3.9.3. 色彩

    • 3.9.3.1. 色调是我们通常所说的“颜色”的精确术语
      3.9.3.1.1. 色调最适合进行类别和群组的编码,而非表示不同数值
      3.9.3.1.2. 一种常见的色调编码是用红色表示股价上涨,绿色代表股价下跌

    • 3.9.3.2. 色彩的另一个维度—强度—既可以编码数值,也可以编码类别
      3.9.3.2.1. 度可以理解为颜色的透明度,因为在大多数常用的可视化程序中,最容易调整的参数就是透明度
      3.9.3.2.2. 强度为0时,颜色就和背景色相同
      3.9.3.2.3. 一种常见的强度编码是用深浅不同的蓝色表示水深
      3.9.3.2.3.1. 蓝色越深,意味着水越深

    • 3.9.3.3. 色调区分大类,强度区分小类
      3.9.3.3.1. 每个大类只用一种色调,大类下的小类用强度区分

    • 3.9.3.4. 用强度突出大类下的元素
      3.9.3.4.1. 用强度来突出某个视觉元素,从而将受众的注意力聚焦到它上面

    • 3.9.3.5. 用色不贪多
      3.9.3.5.1. 色调数量不能太多,以便减轻受众的认知负荷
      3.9.3.5.2. 在色调方面,知识的诅咒影响特别大
      3.9.3.5.3. 经过练习,人可以学会将多种不同颜色与不同类别对应起来
      3.9.3.5.4. 面对不熟悉的颜色和类别,人们就很难快速解析了
      3.9.3.5.5. 用色多对探索性数据可视化是有意义的,但在解释性可视化阶段是危险的

    • 3.9.3.6. 规避色盲风险
      3.9.3.6.1. 如果受众超过20人的话,台下可能至少有一个人患有色觉障碍
      3.9.3.6.2. 要小心红绿组合和蓝绿组合,因为最常见的色觉障碍就是红绿色盲和蓝绿色盲
      3.9.3.6.3. 选择大多数受众都能区分的色调,查看黑白打印的呈现效果

    • 3.9.3.7. 考虑用强度来编码定量变量(不要用彩虹色)
      3.9.3.7.1. 定量变量要用强度来编码,不要用色调
      3.9.3.7.2. 不要用彩虹色
      3.9.3.7.2.1. 彩虹色在科学界内运用广泛,天气图中也常用,但学习难度大,不应用于解释性数据图


3.10. 运用格式塔原理创造意义

  • 3.10.1. 格式塔原理则是帮助我们理解受众对变量的解码方式,尤其是帮助我们预测受众会如何组合视觉元素
  • 3.10.2. 格式塔原理源于20世纪德国心理学家的研究成果,他们试图解释我们今天所说的“分块”过程
  • 3.10.3. 原理有主次

    • 3.10.3.1. 有些格式塔原理的视觉效果较强,所以通过对原理进行组合,变换不同元素的强度,我们就可以改变最突出的元素,影响受众的分块模式

  • 3.10.4. 最小有效差

    • 3.10.4.1. 要使用能达到期望效果的最弱原则,这样制作出来的数据图既能抓住受众,又不会让受众视觉过载

3.11. 围合律

  • 3.11.1. 将视觉上围合的元素当作一组
  • 3.11.2. 外框和区域涂色都是围合的例子
  • 3.11.3. 围合的效果很强
  • 3.11.4. 如果不需要围合就能起到强调效果,那就不要用围合
  • 3.11.5. 用强度和色调代替围合来聚焦重点

    • 3.11.5.1. 围合是视觉效果最强的强调方式之一,容易将其他元素湮没,包括沟通者打算突出的元素在内
    • 3.11.5.2. 围合一般是上级领导改图时会用的,目的是在不重新画图的前提下,快速突出某个点
    • 3.11.5.3. 为了强调一个数据点,不一定要把它围合,可以考虑淡化其他元素,从而让关键数据显得更突出

  • 3.11.6. 分散围合分组

    • 3.11.6.1. 围合常用于分组,哪怕是分散使用,也能起到压倒性的效果
    • 3.11.6.2. 要忍住加方框或圆圈的诱惑,那会产生多个突出点,反而削弱每个点的效力

3.12. 连接律

  • 3.12.1. 将视觉上相连的元素当作一组
  • 3.12.2. 折线图就是利用了这条原理,将各点连接起来,从而营造出线性变动的感觉(通常是沿着时间变动)​
  • 3.12.3. 视觉上相连的点必须有概念关联

    • 3.12.3.1. 用线连接起来的要素必须有概念关联
    • 3.12.3.2. 产品的类别各不相同,最好用柱形图呈现
    • 3.12.3.3. 最常采用线性编码的变量是时间,因为这反映了随着时间变动的基础概念

3.13. 相近律

  • 3.13.1. 将靠近的元素视为属于同一个组别
  • 3.13.2. 利用相近律来省掉图例

    • 3.13.2.1. 图例会加重受众的认知负荷,让他们不得不频繁转移视线,查看图中标示的类别
    • 3.13.2.2. 运用相近律可以让标签更直观,从而减轻认知负荷

  • 3.13.3. 标签要紧贴对应的元素

    • 3.13.3.1. 人眼对远近非常敏感

3.14. 相似律

  • 3.14.1. 认为相似的东西属于同一组
  • 3.14.2. 运用这条原理,你可以让关联变得更清晰
  • 3.14.3. 标签和对应线条要采用相似的颜色,有助于强化两者之间的联系
  • 3.14.4. 利用相似性强化标签的指代对象

    • 3.14.4.1. 标签和对应元素颜色要对应,以便进一步强化关联

3.15. 虽然人类很擅长发现视觉关系,但我们在同一时间只能看到一个信息块,而且我们的注意力会被最突出的元素吸引
3.16. 同一条原理可以多次运用,运用方式各不相同

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册