产品分类

公司简介

上虞市宏兴针织有限公司,是一家拥有进出口自营权,专业生产出口中高档单双面针织面料、时装面料、女装面料、针织坯布、双面针织布、单面针织布、罗纹布、圆筒布料等系列产品的公司,产品主要包括:毛圈(巾)布(二线纬衣,三线纬衣,绒布,天鹅绒等)、复合布、衬垫布、大小循环彩条布、无缝圆筒布(门幅5英寸-40英寸)、提花布、网眼布、汗布、 棉毛布等, 采用丝、毛、麻、棉、晴、涤、植物纤维(天丝,大豆,树脂,莫代尔等)和各种混纺原料,远销韩国、日本和欧美等国家及地区。

黄大仙心水论坛

互联网人要了解的数据可视化 —— 基础篇


更新时间:2019-10-03  浏览刺次数:


  数据可视化对互联网人来说是一项日益重要的技能,现在,从基础开始,一起分享互联网人要了解的数据可视化。

  现如今无论是工作汇报,产品设计,后台设计甚至是数据大屏,越来越多的职业需要和数据打交道。尤其是想要进入一个B端的公司,数据可视化更是必不可少的一个技能。

  数据可视化,可谓是越来越体现一个人的专业能力。因此掌握数据可视化能力,是面向未来的互联网人所必备的能力。

  然而尴尬的是,国内没有一款针对于教学数据可视化的全套解决方案,这让很多渴望学习的同学摸不着头脑。所以这也促使我开启了这个系列《互联网人需要了解的数据可视化》,希望能够给大家带来一些不一样的内容,为大家梳理一个完整的数据可视化框架。

  今天带来的就是这个系列的第一篇,数据可视化的概念以及数据可视化设计的基本准则。

  最近一直在做国际外包,时间非常的零散,而写逻辑性强的文章又非常耗费精力。所以从开题到现在,用了将近2个月的时间才将这篇文章彻底收尾。全文总计25000字左右,阅读需要20分钟左右,干货满满,请大家做好准备。

  数据可视化就是借助视觉的表达方式(不局限于文字),将枯燥的,专业的,不直观的数据内容,有趣的、浅显的、直观的传达给观众的一种手段。

  非设计师在制作数据可视化时,往往会因为重点突出数据的重要性,而让可视化图表变得枯燥乏味。而设计师在制作数据可视化时,又会因为过度注重绚丽多彩而让数据的呈现效果大打折扣。所以在这种大环境下,催生出了数据可视化行业。

  作为设计师,如何拥抱这个新兴的行业,如何把握设计与功能之间的平衡,从而更好的沟通与传达信息,即是本文的重点。

  信息图表,就是数据可视化后产生的结果,就是我们在工作汇报中,项目介绍中,以及后台系统中经常见到的数据图表。

  信息图形由信息和图形两个词语组成,它被称之为“信息图形”(Infographics或Information Graphics)。信息图形最初是在旧的纸质媒体上刊登的,更加有助于人们理解新闻信息的可视化内容。

  根据木村博之的定义,从视觉表现形式的角度,将“信息图表”的呈现方式分为六大类:图解(Diagram)、图表(Chart)、表格(Table)、统计图(Graph)、地图(Map)、图形符号(Pictogram)。

  文字有时候是一种匮乏的信息传递方式,而可视化的方式,则是人类最本源的一种信息传递方式,图解就是将很多无法准确或高效用语言传达的内容,以生动形象的图形解释出来。

  下图是一张经典的对于咖啡种类图解,38种咖啡配方,不必要用多余的文字解释,直接用图解表示,简单明了,清晰易懂。

  图表通常用于简化人们对于大量数据之间的关系的理解,人们通常理解图表会比理解数据要快很多。图表和图解唯一的不同点在于,图解是用可视化的方式去传递信息;而图表则是用来去阐述信息之间的逻辑关系,流程图就是典型的图表。

  下图是一张宠物狗的进化图,用巧妙的方式清晰地向我们传递了,狼是如何被人类驯化成不同种类的宠物狗的。

  表格是按照行和列或者采用更复杂的结构排列的数据,表格广泛应用于通信、研究和数据分析。其实表格并没有一个确定的定义,它会因为不同的行业和谈论环境而存在差异。

  统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。它具有直观、形象、生动、具体等特点。

  统计图可以使复杂的统计数字简单化、通俗化、形象化,使人一目了然,便于理解和比较。因此,统计图在统计资料整理与分析中占有重要地位,并得到广泛应用。

  下图是大城市通勤的时长统计,通过这些柱状图,我们能很清晰看出各个级别的城市通勤时长的比例关系,并了解他们的拥堵时长和非拥堵时长分别是怎样的情况。

  实际上,要说“省略”是地图上最关键的词也不为过,无论是哪种信息地图,最重要的是让用户找到想要看到的信息。

  所谓图形符号(也就是我们常说的icon),基本就是通过易于理解、与人直觉相符的图形传达信息的一种形式。

  生活中处处存在图形符号,包括地铁站出入口上的地铁标识,路边的指示牌与限速标识。人们会约定俗成地运用一些符号来代表一些固定的意思,比如厕所门口的男女标识。很多商店为了个性化设计,使用了不常用的符号来表示男女,这会给消费者造成很大的困扰,因为这脱离了他们常见的理解范围。

  多年来,最经典的图形符号应用案例可以说是奥运会和残奥会的运动图标了。图形符号可以说已经成为奥运会和残奥会的重要组成部分,就像火炬传递和运动会LOGO一样,从赛事门票到奥运村的品牌,图形符号都在被广泛使用。

  目前我们工作中经常遇到的数据可视化,大多数是制作数据图表(即统计图Graph),所以我们本文的主要教学内容也是围绕着如何制作统计图来说。

  制作统计图的过程可以被四个步骤,分别是:明确目的、选择图表、视觉设计、突出信息。

  明确目的:明确数据可视化的目标,通过数据可视化我们要解决什么样的问题,需要探索什么内容或陈述什么事实,并选择合适的图表。

  选择图表:围绕目标找到能提供信息的指标或者数据,选择合适的图形去展示需要可视化的数据。

  突出信息:根据可视化展示目标,将重要信息添加辅助线或更改颜色等手段,进行信息的凸显,将用户的注意力引向关键信息,帮助用户理解数据意义。

  标题应该是一个结论,是你希望面试官从中获得的信息(有意义并且有趣的部分),而不仅仅是对图表展示内容的概括(即无意义且无趣的部分)。

  Andrew Abela根据统计图的主要功能,将所有的统计图分为了四大类:比较、联系、分布、构成。在其资料的基础上,我制作了一套更适合设计师的“图表选择器”(The Way of Data Visualization)。

  通过上述图表选择器,我们可以轻易地根据我们想要展现的数据的种类,以及我们制作图表的目的,来选择到合适的图表。

  但是日常工作中,我们往往用不到这么多的图表种类,这个“图表选择器”更适合我们作为学习图表概念的工具。日常工作中,有六种基本图表已经可以覆盖我们大部分的使用场景,也是做数据可视化最常用的六种图表类型。

  所以作为新手的我们,只要能熟练掌握这六种图表,即可应付大部分的使用场景,而对于我们这种更专业的人士来说,上述的“图表选择器”能够大大提高我们的工作效率。

  很多时候我们在设计图表时没有既定的规则,全凭借在平面设计和UI设计中获得的知识来进行设计。但之所以数据可视化被单独细化成一个类别,并在国外蓬勃发展,甚至衍生出了专业的数据可视化设计师,就证明在数据可视化领域,很多规则是与其他设计不同的。

  首先,适用于数据可视化的配色方案,一定在明度上是有变化的。很多配色方案不仅不具备这种特性,甚至不会考虑包容性。

  UI设计的配色方案看起来都很绚丽多彩,但是很明显,他们是为了用户界面而设计的。色盲人士往往很难去阅读那些运用了低包容性配色方案的可视化图表。

  另一个问题就是,大多数配色方案并没有足够多的颜色种类。在构建一套完整的可视化图表时,我们往往至少需要6种颜色的调色板来进行设计,我们见过的大多数配色方案并不具有这么多种颜色。

  虽然这些配色方案同样绚丽多彩,但是他们不能灵活应对图表中复杂的信息层级。

  渐变配色方案可以轻松解决上述两个问题(颜色之间有明显的对比,且可以无限细分颜色种类)。但很抱歉,这样的配色方案同样不适用数据可视化,我们举一些简单的例子大家就可以明白。

  这些渐变色看起来没什么问题,但是当我们选择其中一个,将其颜色分类扩充到10时问题就出现了。

  在“视觉设计”这一章我将重点讲解,数据可视化(即图表制作时)需要注意的设计准则,下面的内容主要解决大家在数据可视化中所遇到的三个问题。

  如果你的听众只需要了解A数据大于B数据,那么刻度线是没有必要的,只需在坐标轴上使用小刻度即可。如果你的读者要花一些时间在柱状图上并感兴趣A数据是45.65而B数据是37.66,那么使用刻度线将有助于他们理解。

  如果确定要使用刻度线,则需要使它们比作为实际数据的点或者线条要层级低。因为这些刻度线也属于背景的一部分。

  总结来说,不要使用全黑或者全白的线条。如果你的背景颜色是白色或者浅色系,那么你应该让你的线条灰一些。你也同样可以让这些线条变成亮灰色,点状或者虚线。

  你也可以使用灰色的背景,然后将刻度线反白,这是一种很好的利用负空间做设计的方法;或者刻度线可以用稍微偏黑色一点的灰色,因为很明显这样会让刻度线更融入背景一些。

  坐标线应该比刻度线,线条更粗,颜色更深,才能让整个图表显得更有主次的区分。

  有人会问,这样的话我们的数据就会变得没有那么起伏变化了。那可能是因为你的数据本身就没有那么长势喜人。

  但同样,其实很多事情可以反过来思考,之所以有人愿意不把坐标轴设定为0为起点,其实就是为了在视觉上让人形成对比强烈的感觉,从而突出业绩,这种方法的使用因人而异。

  比如在小米的发布会中,为了对比,小米把数据的下限起点设置为了10000,从而使小米的跑分数据看似跑赢了友商一倍还多,但其实小米的数据增长,只比友商高出了25%。

  3月31日目标的值为7,066,000,比6,000,000高17.8%,然而第二个柱形几乎是第一个柱形长度的三倍。

  这也同时提醒我们要注意:在观看别人的图表时,仅仅观看柱状图的高低趋势往往不能得出正确结论,需要注意坐标轴起始位置有没有被人做过虚假处理。

  同样,有些人为了汇报业绩,也会使每个刻度的跨度不一致,从而提高柱状图整体的对比度。这种情况也应该多留心观察,不要被表面的内容所迷惑。

  坐标轴中另一个需要注意的点即为坐标上限,上限界定的方式有两种,可根据需求自行判断。

  虽然Y轴的刻度值标签通常放置在刻度线的最左边,但我们也可以把它们放置在其他的地方,比如刻度线的顶部(但此时一定要把握好亲密性原则,稍不注意就会引起观众的困惑,这也是我们经常会在看其他图表时遇到的问题,到底刻度值标记的是哪一条刻度线?)。

  刻度线和刻度值相辅相成,这会让图表看起来更加规范。刻度值放置在哪里无所谓好坏,只是需要根据不同的场合加以使用。

  在坐标轴上应该使用均匀的跨度0,5,10,15,20,而非不均匀的跨度0,3,5,16,50。这里即呼应上方“坐标轴下限”中的最后一点,有时图表制作人也会用不均匀的刻度来蒙骗我们对数据产生误解。

  当然,此处的举例只是夸大了错误的效果,现实生活中的不均匀刻度往往更加隐蔽,需要我们仔细去甄别。

  有时坐标轴上的注释文字会很多,所以很多人为了妥协,在小空间内显示出所有的文字标注内容,而使用倾斜的文本,或者将文本转行处理。

  不要用过于复杂的设计形式,数据可视化的第一要义是简单易懂,所以在遇到标签文字过长时,可以采用以下方法进行解决。

  我们在每次制作前都对数据进行排序,而不是随机排布。这样我们可以在图表中为观众展示更多信息,即某个数据在总的数据库里面的序列。

  目前的排布很随机,或者是按照字母表排序的。接下来我们要按照数值从大到小进行排列。

  我们随机挑选一组数据,比如玻利维亚(Bolivia),在上图中,我们只能得到玻利维亚的数据值,以及他大概在数据库中排在中游的位置,仅此而已。

  但是下图中,根据大小排列好的数据,我们不仅可以获得刚才的两个信息,同时还能马上知道玻利维亚在整个图表中的排名(第四名)。

  同时你还可以看到吉尔吉斯斯坦(Krygyzstan)和越南(Vietnam)居于榜首而美国(America)是倒数第一,这就是好的图表能给我们带来的“更多的信息”。

  我们再看一遍按照字母表排序的图表,你能轻易说出“冈比亚(Gambia)”排名第几吗?

  在发布会中我们常常见到,为了突出自己产品的强悍,往往要与友商的数据做对比,在这种情况下,www.336246.com,我们的数据也不是随机排布的,我给这种数据排布方法起了个名字,叫“刻意的序列”。

  在魅族 16th的发布会中,这张旗舰机重量对比的图表很有讲究,可以发现,除了索尼(最重的手机)以及魅族 16th(最轻的手机)外,其余所有的手机都是按照降序排列。不看颜色对比,把236g的索尼和152g的魅族放置在一起进行讲解,以更加突出魅族的轻薄。

  这就是我们学习数据可视化时非常需要注意的细节点,在数据可视化中,细节决定成败。

  我们有时为了保证图表的清晰整洁,并不能完全选择符合数据上限和下限的数字作为刻度,而是选择一些取整的数字。

  在需要用多种颜色做区分的图表中,有时可以通过标记图例边界而不是标记图例范围的方式,来提高观众的阅读效率。

  对于数字的刻度,水平图例往往比垂直图例更加容易阅读,因为这符合我们的阅读习惯。

  但是,对于有类别区分的图例来说,垂直图例往往效果更好。因为我们可以在图例的右边放置更长的文本(跟坐标轴的注释同样的道理)。

  有时我们甚至可以更简地的表示图例,当你只想表达一个渐进的过程,24和55之间的差异并不重要,观众只需要知道后者比前者大即可。

  在这种情况下,我们可以尝试只标记出图例的最大值和最小值,而不必要标记出每个边界或者颜色,这样可以给观众减少不必要的信息负担。

  文字标注的作用,不是来填充空白的,而是用来强调相关信息或拓展额外的背景知识的。

  大多数情况下,我们制作的图表都不会将原数据附在旁边,因此最好在图表中引用你的数据来源。一般来说,引用规则是在左下角防止数据来源信息,往往采用特殊字体。

  引用消息来源,既可以方便你随时索引数据来源(就像我文章开头的每一个图表都标注出了他的原标题+索引网址),也可以增加数据的可信度(有趣的是,人人往往不会关注数据来源于哪里,只要有来源,就会大大增加人们的信服感)。

  有时你需要在你的图表中标注出数据值,而不仅仅应该依赖视觉元素向观众传达信息。

  图表中的字体数量以及字体大小的种类加起来不要超过3种(标题和副标题除外)。

  通常来说,我们在制作时会把注释和坐标轴标签设置为两种字体样式,所以只需要确保将这两者统一起来,那么就可以保证我们的图表不超过3种字体样式。

  过宽的柱会让图表看起来笨重,尽量保持柱的轻薄;这样可以保持优雅的外观,但是太薄了会让用户很难对数据进行比较。

  标准的数值是,柱的宽度为“柱与柱间距”的2倍。当然这只是个参考值,实际我们根据不同的情况,对宽度作出调整。

  一般进行数据比较时,柱状图建议不要超过5个数据值,对于条形图来说,建议不要超过7个数据值。

  2)什么时候使用折线月的大米出口量是相关的,他们代表一种数据在不同时间下的数据值,因此我们可以用折线图将它们连接起来。但是2017年1月的大米出口量和玉米出口量(16万吨)是不相关的,所以我们不能随便用折线图来代替柱状图。

  用折线图可以很好地表示每天去医院的人数,因为统计每天去医院的人数可以用来观察趋势。

  有时我们也需要进行一些区分。如果我们想要绘制美国大规模枪击事件的伤亡人数随时间推移的图表。这些枪击事件确实是一个接一个发生的,但是它们本质上却没有关系,所以你不能用折线图(应该用条形图)。

  饼图是一种应该避免使用的图表,因为肉眼对面积大小不敏感,并且几乎没有对与角度大小的概念。更何况是肉眼完全无法重合比较的图形。

  例如上面左图,我们很难去比较每日从肉类(Meat)中摄入的卡路里与从糖类(Sugar&Fat)中摄入的卡路里数量的比例。人眼的直觉中,糖类与肉类的比例应该在2:1左右,但实际的比例却是1.5:1。

  上述右图将这一现象放大的更加明显。人眼的直觉中,办公与接待的数值差距非常大(这是由于我们直觉更习惯从面积上做判断),但实际上接待与办公的比例为1.5:1。

  那么有同学会问:分割多少块是过度分割?这是一个需要在实际制作时进行判断的问题。

  一个简单的方法,如果我们已经很难从图中看出其中一块扇形是另一块的两倍大了,或者好几块较小的扇形看起来差不多大时,那么就不能再分割了。此时可以考虑把较小的类目归入一个更大的“其他”模块。

  左边这张饼图已经分割出了无数个扇形了,但旁边另分离出一张饼图,显示出了左图中更多的,看不到的更小国家的情况,以此来提供更多的信息。其实还有很多的方法可以展示这组数据,例如树状图或者普通的地图。

  人们的阅读习惯往往是从12点钟开始的(跟表盘类似)。所以我们在制作饼图时也要遵循观众的阅读习惯,从12点钟方向开始制作,这样才能呈现出更加清晰的数据。

  这个规则与其他的数据图表一致,我们在拿到数据后,不要急于去进行数据可视化,而是应该对数据进行排序处理,一般来讲,我们对于图表都要进行从大到小的数据排序,才更有利于我们展示数据,但是有一个例外的情况。

  当我们将饼图分拆开来设计时,将他们设置为同一起点,我们可以清晰的对比出数据的大小,但严格意义上来讲这已经不算是饼图了。

  当包含多重变量时,散点图本身包含2个维度的数据,当出现更多维度时,我们可以通过改变散点的颜色和大小甚至是形状来对数据进行更多维度的划分,这个时候,散点图即变成了气泡图。

  通过添加趋势线,可以更好的让观众感受数据的变化,人们不会愿意接受未处理的数据,往往倾向于接受已经被处理好的数据结果。

  相对于折线而言,被填充的区域可以更好的引起人们对总值趋势的注意,所以面积图主要用于传达趋势的大小,而不是确切的单个数据值。面积图有三种不同的形态,根据数据以及背景的不同,均有其最佳的展示环境。

  面积图只适合展现少量的数据,最多建议不要超过四个类别,否则就会导致非常难以识别。因此在多个类别下,要尽量避免使用面积图。

  如上左图,通过添加辅助线和标红的方式,来显示快递公司未达到60万件派件标准的月份,从而突出显示公司业绩不合格部分。如上右图,通过对9月份的颜色区分,来突出显示二手房价格在9月份达到前所未有的高度。

  数据可视化的精髓就在于你去用视觉元素去帮助用户做筛选,如果观众们真的很想知道每个数据代表什么,那或许你应该给他们展现一份表格而不是图表。

  关于这个图表,如果我们不进行标注的话,它只能讲述故事的一部分。如果要把故事讲述的全面,那么就必须添加一些标注。

  如果我告诉你,这个图表想告诉我们,在第6天的时候该团队使用了敏捷开发,在使用新技术初期,Bug数量明显上升,而后瞬间下降。加上了标注,图表讲述了一个跟之前完全不一样的故事。

  比如像这个图表,为了体现出响应速度有很大的提升,,添加了相关辅助线并标注了相应的数字,使 PRO5 和 SONY Z3+ 之间的对比更加明显。

  以上就是该系列的第一篇的全部内容,后续我将以此为基础更新更多关于数据可视化的知识,从数据图表、信息图表、后台设计、甚至到大屏数据可视化,都有可能涉及。

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立9年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。