当前位置:首页 > 人工智能

如何成为数据分析师系列(二):可视化图表进阶

发布时间:2019-05-08 18:05:55   编辑:it技术学习网   阅读次数:

如何成为一名数据分析师系列(二):可视化高级图表
摘要:如何成为一个数据分析系列以下(A):可视化功能图表基本精加工生产线图,柱状图,散点图,饼图和它的四个基本使用场景,这个时候完成一些平时不使用,但它们使用适当的场景,经常为你的图表分析加分不少。关键词:数据分析师下面就如何成为一名数据分析师系列(一):可视化图表基本完成图线图,条形图,散点图,饼图和他们的使用场景的四个基本特征,这一次整理了一些常见的少用,但他们使用适当的场景,往往是加分不少你的图表分析。

应当指出的是,这张图展示了几乎所有的T一个bl?au制造“对自己的学习的原因,”不再受Excel图表制作。其中一些图表,Excel中还可以使,一些没有产生一个合适的使用Excel。

无花果树(TreeMap中)

如何成为数据分析师系列(二):可视化图表进阶

功能与应用场景

的主要功能是用于可视化的一个组成部分之间的块的局部电平(用不同的颜色来区分块)由矩形区域大小关系表示的关系,。

缺点

它代表的区域中,当接近人眼的值是难以区分的大小,当然,可以针对通过填充值来补偿。

图漏斗(漏斗图)

如何成为数据分析师系列(二):可视化图表进阶

方案

用于数据比较的任务关键方面,所述系列的各个方面在一起以形成漏斗,该过程的各方面内量化,跟踪的转化率的所有方面。转化率表示主要信息漏斗。

电商类:访问 - >注册 - >购物车 - >订单 - >付款; 营销:显示 - >点击 - >访问 - >咨询 - >订单 - >付款; CRM:潜在客户阶段 - >客户利益的阶段 - >谈判阶段 - >签署协议。

这些只是普通漏斗,实际的业务流程可以建立漏斗。

缺点

在实际的分析图漏斗是不常见的,但作为在PPT中描述的信息是比干燥数字显著更好

跟踪过程比较困难,但企业是注重实效,我们更关注的是整个过程的转换,有时不会进入细节; 有时我们更关心的是在时间维度的转换率的某些方面的变化。

漏斗VS行为路径分析

漏斗图分析,在路线图中的行为进行区分,道路往往是你的访问路径用户是未知的行为分析,但漏斗图是基于已知的关键流程建设。

风格的变体:面积的条形图风格的变体形式,更清晰

如何成为数据分析师系列(二):可视化图表进阶

图雷达(RadarChart)

如何成为数据分析师系列(二):可视化图表进阶

方案

图主静雷达多维相反,它提出了多种视觉观察目标上在比较多个指示器。

缺点

可以表示静态数据信息是有限的,不超过五个线,指标不应超过8。

注意事项

雷达图指标必须为正,并且可以进行比较,即,更好的代表索引,并且当该指数差大,需要标准化,消除单元的影响。

表征指标必须是相同的含义:由于所有的越大越好,越小越好,或有代表性的代表; 图雷达数据必须被归一化; 图雷达是非常静态的数据量,也可以是一个时间维度。

生产工艺

图数据。

如何成为数据分析师系列(二):可视化图表进阶

数据源 - 第一指示符重复一个,如开始和结束环; 数据透视表中的Tableau要执行的操作; 生成路径:CASE [透视字段名]

当“恢复率认证两分钟就那么1

当“认证编号”,那么2

然后3 WHEN“内2分钟消息响应率”

WHEN“消息恢复率”,然后4

WHEN“回复消息号”,那么5

当“质量得分”,那么6

ELSE 7

结束

产生电弧:IF [路径] = 7 THEN PI()/ 2 ELSE PI()/ 2 - ([路径] -1)* 2 * PI()/ 6 END生成X = [透视字段值] * COS([弧度])中,Y = [数据透视表字段值] * SIN([弧度])

如何成为数据分析师系列(二):可视化图表进阶

箱形图/箱线图(专栏图)

如何成为数据分析师系列(二):可视化图表进阶

箱线图使用五个统计:最小值,第一位数,3位数字的第二位数,所述图形描述数据最大值。

方案

主要用于观察数据的分布:分布&观察离群&偏斜等。

盒形图直观地了解所观察到的数据分发,用于比较的数据分布的不同批次的数据; 盒形图直观地和清楚地在批处理识别离群值的数据; 盒形图初步判断数据批偏斜度尾和重量; 异常值的出现在中间垂直从多个中央位置偏移四分位数的一侧的概率越高; 离群集中在一侧上的小的值,呈现的左偏分布; 离群值集中在一个大的值的一侧,然后呈现右偏分布。

图形元素说明

如何成为数据分析师系列(二):可视化图表进阶

对应的数据Q1,Q3位数,一个矩形框中线内侧引出的端部的时刻带盒位置

在一定范围内= Q1-1.5 * IQR = Q3 + 1.5 * IQR IQR(四分时刻)= Q3-Q1,这反映了50%的分散体的中间数据的程度(数值越小,中间数据集的50%)外极限= Q1-3 * IQR = Q3 + 3 *比限制值IQR位置异常,这是内限值和外部界限(轻度异常值)之间的轻度异常值,它称为极端值外部界限外(极端值)。

应用实例

如何成为数据分析师系列(二):可视化图表进阶

甘特图(甘特图)

如何成为数据分析师系列(二):可视化图表进阶

方案:项目管理

该项目描述的各要素的作用甘特开始和结束日期是非常好的,清晰的内容需要做,截止日期是项目成功的关键。在大多数情况下,我们甘特图和项目管理联系在一起,但实际上它也可以用来显示一段时间内的事(人,机,订单等的变化。)。

显示项目进度。例如:主要成果说明,业主,限期。使用的东西随着时间的推移其他显示项目。例如:机器的使用的持续时间,免费或没有团队成员,订单交付时间等。

图桑基(热平衡图)

如何成为数据分析师系列(二):可视化图表进阶

热平衡图,即图桑基分流能量,也被称为能量平衡热平衡图。

起源

1898年的“能源效率蒸汽机地图”的马修·亨利菲内亚斯·里尔桑基图是世界著名的,从那以后,它的名字是“热平衡图”。

方案

它显示了分类的尺寸,在同一类别中的元素的数据流数的形式呈现之间的相关性; 表示发展,如特定人群,诸如分布的群集:杏仁活性医生在一个过渡时期的活动状态; 的流程图的性质,表现出能量/物质流。

核心特性

最明显的特征是分支宽度的端部和开头每个等于总,我。e。所有的主支路的总和应当等于所有分支点的总和的宽度从能量平衡的宽度。

图形制作

1。S曲线-sigmoid函数的恒等式

如何成为数据分析师系列(二):可视化图表进阶

图像功能的特点是:1。 连续,平稳和严格单调; 2。关于(0,0。5)对称; 3。范围为(0,1)。

1。简单的地图数据格式桑基。左到数据,正确的模式模型,显示出从位置1的变化的用户的请求ID热平衡图来定位路径的2。

如何成为数据分析师系列(二):可视化图表进阶

如何成为数据分析师系列(二):可视化图表进阶

a。 连接Excel文件,数据模型和数据被内拖动加入链路相连; 乙。 创建计算字段Sigmoid函数表示S曲线函数:1 /(1 + EXP(1) - [T]); C。 表示产生的计算出的字段曲线曲线:[位置1] +((位置2] - [位置1])* [S形函数]); d。 它拖拽到T [柱],拖动曲线[线]和尺寸的连续调整; ?。 姓名,身份证拖细节,名称拖到颜色; F。的线型选择标记,一个简单的桑基图完成后,示例性文件中看到的Tableau。

如何成为数据分析师系列(二):可视化图表进阶

难点赞赏:如何生成曲线!

每个用户具有位置1,位置2,向用户ID = 1作为一个例子:

位置1 = 1position2 = 100 [职位2]  -  [位置1] = 99([位置2]  -  [位置1])* [SigmoidFunction]

式被称为A,根据特性曲线S,如T->负无穷大,则该函数S-> 0,A-> 0; 因为,当t增加时,s增加到的功能是严格单调; 当T->正无穷大,S-> 1,A - >([位置2] - [位置1])。因此曲线= [位置1] +((位置2] - [位置1])* [Sigmoid函数]),以产生一个曲线S。

困难的是设置位置,这样附近的每个类别分。不仅大类接近,但也接近细分类别

词云

如何成为数据分析师系列(二):可视化图表进阶

方案

词云是描述事物的主要特征,需要让人们一看便知的东西主要特征越明显越要突出特征的能力。不字云和云词,要注意使一个字云表达什么信息(包括是什么关系数据)

基于内容的网站,以使内容关键字提取的词云网址导航; 刻画人物肖像,肖像刻画的东西,小说的中心主题描述,总之,被描绘与各种事物的主题,你可以用一个词云,如果它是分层性能的关系,所以不建议使用词云。(下图是不是最合适的使用词云场景)

如何成为数据分析师系列(二):可视化图表进阶

主要特点

词云是更多的图形艺术的可视化。字直接向显示对象,字字体大小代表了一些度量。

这些图表的导入型。事实上,有许多,许多图表类型,诸如鼠标点击基于热图,网络图,等。基于蔓延,但他们不再适合在Excel或生产的Tableau使用,需要与R / Python的图纸,暂时用不上,就不再需要写下来。

此外,也有图表的问题,比如很多的想法:背景颜色使用

黑色背景给人以震撼,但其情感基调是庄严的,悲伤,紧张的白色背景比较单调,但其情感基调是轻松

如何使用特定的图表,它是非常灵活的,见仁见智。其基本原理是采用透明混凝土的图形演示如何仍然需要的业务场景,如目标的分析组合。

本文链接:如何成为数据分析师系列(二):可视化图表进阶

友情链接: 心经结缘 大悲咒 大悲咒功德
网站地图
it技术学习网版权所有   苏ICP备18043316号