加入收藏 | 设为首页 | 会员中心 | 我要投稿 新余站长网 (https://www.0790zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据大佬教你简单容易的绘制Excel中的箱线图

发布时间:2021-06-05 11:13:09 所属栏目:大数据 来源:互联网
导读:箱形图的适用场景 箱形图适用于展示顺序数据,通过它我们可以观察出顺序数据的集中趋势和离散程度。 箱形图是由5个统计量组合而成的图形,它们分别是:最大值、最小值、中位数、上四分位数和下四分位数。下面,我们用箱形图来展示如下各学生的学生成绩数据:
箱形图的适用场景
箱形图适用于展示顺序数据,通过它我们可以观察出顺序数据的集中趋势和离散程度。
箱形图是由5个统计量组合而成的图形,它们分别是:“最大值”、“最小值”、中位数、上四分位数和下四分位数。下面,我们用箱形图来展示如下各学生的学生成绩数据:
数据大佬教你简单粗暴的绘制Excel中的箱线图
箱形图如下图所示:
数据大佬教你简单粗暴的绘制Excel中的箱线图
可以看出该箱形图中一共显示了6个数据,5条线段。下面,我们依次来解释它们所代表的含义。
“最大值和最小值”:在Excel当中,箱形图中的最大值其实是指去除异常值后的最大值和最小值,然后将它们作为整体图形的上下两条边界线。
还有一种箱形图则是将图形的上下两条边界线用区分异常值的边界线来表示。此时,上下边界线又称之为异常值截断点,该点的计算方式如下:
上异常值截断点 = 上四分位数+1.5*IQR(IQR即四分位差)
下异常值截断点 = 下四分位数-1.5*IQR(IQR即四分位差)
因此,在异常值截断点之外的点就是异常值,如图中点30。
数据大佬教你简单粗暴的绘制Excel中的箱线图
中位数:代表数据集中趋势位置的数,它表示这组数据大部分是集中在哪个数的附近,在这组数据中即表示了大多数的学生成绩是在75.5分左右。
四分位差(IQR):IQR = Q3(上四分位数)-Q1(下四分位数)。
四分位差表示了一组数据中间50%的数据的离散程度,通过它我们可以来衡量中位数的代表性。如果IQR较大,则说明中间50%的数据相对分散,中位数的代表性则不好;如果IQR较小,则说明中间50%的数据相对集中,中位数的代表性则较好。
此外,我们还可以通过图形的整体长度,即极差来观察数据的整体分散程度。
那么,如何来绘制箱形图呢?
Excel 绘制箱形图
下面,我们一起来看下如何在Excel当中绘制箱形图:
数据大佬教你简单粗暴的绘制Excel中的箱线图
Excel箱形图默认还将这组数据的平均数标记出来了,因此,还可以通过平均数和中位数的相对位置判断数据分布的状况。若平均数在中位数上方则表示数据右偏;若平均数在中位数下方,则表示数据左偏。
在该组数据中,由于小钱同学的成绩只有30,是这组数据的一个异常值,导致数据左偏,也就是“ 将平均成绩拉低了!”

(编辑:新余站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读