深坑预警!请避开数据可视化6大灾难
本文来源:新浪网
原文标题:深坑预警!请避开数据可视化6大灾难
本文作者:宠物都是宝额外
数据,现在似乎已经成为了很多事情的基础。一个好的研究,和研究中得到的良好数据,可以让任何问题都得到科学的解释,而并非仅仅只是通过“直觉”来解决。
现在面临的问题是:受众往往对统计分析并不那么了解。因此尽可能以简单的方式像受众展示数据至关重要,比如用可视化的形式——图表、曲线图、信息图等来展示,这样会让受众更容易理解。
因此,如果你要向外行人士展示数据的话,一定要避免落入下面的陷阱。
1. 对数据使用错误的可视化工具
你展示数据的目的是什么?
你是根据研究问题划分研究群体吗?如果是,饼图很不错。
你要比较人口、时间吗?如果是,柱状图更好。
如果你想比较两件事(例如,高管和普通员工随时间推移的平均加薪情况),线形图是很好的选择。
但是,研究员、统计学家和设计师们往往执着于特定类型的图表或曲线图,他们尝试“强行”将其数据转换成特定格式,但结果常常并不是很清晰。看看相似类型的数据可视化方式,你会发现,你可以用之前没用过的设计来更好地展示自己的数据。
2. 将过多的数据堆到一张可视化图里
一般如果你想展示所有的信息,那么就很容易把所有想说的全放到一张可视化图里。可能你知道图里所有小细节,而受众却并非如此。
你可以想想展示的主要目的,以及还有什么更小的细节可以忽略吗?你能把复杂的演示拆分成一系列的可视化图,而不是把它全塞到一张图里吗?
要记得从受众的角度看看你的图,特别是当以非口头解释和接受提问的方式向观众展示的时候。现场展示时,你可以预估观众的反应,澄清误解,解答问题,但若非现场展示就不能这样了。
3. 可视化图太“满”
图里有多种颜色和各种图形当然可以,但是过多的话就会分散受众的注意力。当颜色或图形太多的时候,往往会引起受众的厌倦而不想去看。
强烈建议制作者找一个更简洁的模型,或者把数据放到几张图里,然后说明该国不同地区的趋势。
4. 令人困惑或错误的数学
一旦一张图表里出现了相加后的和不是100或者虽然数学上没有错误但却令人困惑的数字,数据可视化就就毫无价值了。比如很常用的用于表现百分比的饼状图——百分比的总和必须为100,否则就会让人感到困惑,怀疑数据的正确性。
实际上,研究员允许受访者选择多位候选人,于是就得到这一数学结果。这场灾难的补救措施是只允许选择一个候选人,这样百分比相加的和就是100了,或者将这一可视化图分成三张图,每位候选人一张,并标注受访者的第一,第二,第三选择。
5. 缺乏数据来源
数据的有效性取决于其来源,学者和研究员都明白这一点。非学者在收集数据、创建图表的时候,可能不明白标注数据来源以及使用可信赖数据的重要性。
一手资源是指研究人员通过自己收集分析数据得到的资源,在将数据可视化的时候,如果要使可视化可信,就应该使用这些一手资源。
6. 在发布或展示之前没有进行测试
当你全身心投入到创作中时,很可能无法意识到一些显而易见的错误或者误区。这个问题的解决办法是,先向不熟悉该数据主体的朋友或同事展示你的可视化图,然后让他们解释给你听。如果他们解释得很好,你就可以发布了。
大红鹰(dhy9999)有限公司是一家致力于系统集成多媒体投影显示、智能会议办公教学系统、大屏幕视频拼墙系统、大数据可视化软件开发、人工智能领域技术普及和应用的股份制公司。集项目建设、产品研发生产、售后维保服务三位一体的高新技术企业。经过多年的发展,已拥有5000多家紧密合作的区域经销商和最终用户。客户群体涵盖政府、军队、交通、能源、广电、金融等产业方向的尖端企业。