Python boxplot 用法详解

详解:

箱型图提供了识别异常值的一个标准:

异常值通常被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。

QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;

QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;

IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差,其间包含了全部观察值的一半。

最小值 (minimum);

下四分位数 (first quartile, Q1);

中值或中位数 (median), 或第二个四分位数 (second quartile, Q2);

上四分位数 (third quartile, Q3);

最大值 (maximum)。

四分位间距 (interquartile range, IQR), 表示下四分位数Q1和上四分位数Q3的间距;

离群值 (outliers),表示小于minimum的值和大于maximum的值。

箱型图依据实际数据绘制,没有对数据作任何限制性要求(如服从某种特定的分布形式),它只是真实直观地表现数据分布的本来面貌;

另一方面,箱型图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的鲁棒性:多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响。

由此可见,箱型图识别异常值的结果比较客观,在识别异常值方面有一定的优越性

boxplot(x, notch=None, sym=None, whis=None, positions=None,
        widths=None, patch_artist=None, bootstrap=None, usermedians=None,
        conf_intervals=None, meanline=None, showmeans=None, showcaps=None,
        showbox=None, showfliers=None, boxprops=None, labels=None,
        flierprops=None, medianpropos=None, meanprops=None, capprops=None,
        whiskerpropos=None, manage_ticks=True, autorange=False,
        zorder=None, *, data=None)

x:绘制箱型图的数据。

  ·sym:表示异常值对应的符号,默认为空心圆圈。

  ·vert:表示是否将箱形图垂直摆放,默认为垂直摆放。

  ·whis:表示箱形图上下须与上下四分位的距离,默认为1.5倍的四分位差。

  ·positions:表示箱体的位置。

  ·widths:表示箱体的宽度,默认为0.5。

  ·patch_artist:表示是否填充箱体的颜色,默认不填充。

  ·meanline:是否用横跨箱体的线条标出中位数,默认不使用。

  ·showcaps:表示是否显示箱体顶部和底部的横线,默认显示。

  ·showboxs:表示是否显示箱形图的箱体,默认显示。

  ·showfliers:表示是否显示异常值,默认显示。

  ·labels:表示箱形图的标签。

  ·boxpropos:表示控制箱体属性的字典。

用法:

diamonds = pd.read_csv('./data/DiamondsPrices2022.csv')
diamonds.boxplot(column=['price'], showmeans=True, return_type='axes', figsize=(8, 8))
plt.title("价格中的异常值", size=12)
plt.show()

到此这篇关于Python boxplot 用法详解的文章就介绍到这了,更多相关Python boxplot 用法内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python pyecharts Boxplot箱线图的实现

    本篇博客只是单纯的记录一下自己学习Boxplot,没有过多的解释,官网:>>Boxplot import seaborn as sns import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif']=['Microsoft YaHei'] # 用来正常显示中文标签 p

  • Python使用plt.boxplot() 参数绘制箱线图

    Python 绘制箱线图主要用 matplotlib 库里 pyplot 模块里的 boxplot() 函数. plt.boxplot() 参数详解 plt.pie(x, # 指定要绘制箱线图的数据: notch=None, # 是否是凹口的形式展现箱线图,默认非凹口: sym=None, # 指定异常点的形状,默认为+号显示: vert=None, # 是否需要将箱线图垂直摆放,默认垂直摆放: whis=None, # 指定上下须与上下四分位的距离,默认为1.5倍的四分位差: position

  • Python Matplotlib绘制箱线图boxplot()函数详解

    目录 箱线图 boxplot()函数还提供了丰富的自定义选项 箱线图通常用在多组数据比较时 补充:plt.boxplot()函数绘制箱图.常用方法 实战 常用方法 总结 箱线图 箱线图一般用来展现数据的分布,如上下四分位值.中位数等,也可以直观地展示异常点.Matplotlib提供了boxplot()函数绘制箱线图. import matplotlib.pyplot as plt _ = plt.boxplot(range(10)) # 10个数,0-9 plt.show() 箱线图虽然看起来简

  • Python boxplot 用法详解

    详解: 箱型图提供了识别异常值的一个标准: 异常值通常被定义为小于QL-1.5IQR或大于QU+1.5IQR的值. QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小: QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大: IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差,其间包含了全部观察值的一半. 最小值 (minimum); 下四分位数 (first quartile, Q1); 中值或中位数 (median), 或第二个四分位数 (second qua

  • Python.append()与Python.expand()用法详解

    如下所示: alist=[1,2]] >>>[1,2] alist.append([3,4]) >>>[1, 2, [3, 4]] alist.extend([3,4]) >>>[1, 2, 3, 4] 结论: list.apend(arg1) 参数类型任意,可以往已有列表中添加元素,若添加的是列表,就该列表被当成一个元素存在原列表中,只使list长度增加1. list.extend(list1) 参数必须是列表类型,可以将参数中的列表合并到原列表的末

  • python递归函数用法详解

    上期我们介绍了函数式编程,这期内容就是关于递归的函数内容,本期还是按照老规矩,给大家进行核心整理,内容通俗易懂,搭配实际应用,以供大家理解. 关于递归: 百度解释:是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象.在计算机编程里,递归指的是一个过程:函数不断引用自身,直到引用的对象已知.使用递归解决问题,思路清晰,代码少.但是在主流高级语言中(如C语言.Pascal语言等)使用递归算法要耗用更多的栈空间,所以在堆栈尺寸受限制时(如嵌入式系统或者内核态编程),应避免采用.所有

  • Python self用法详解

    在定义类的过程中,无论是显式创建类的构造方法,还是向类中添加实例方法,都要求将 self 参数作为方法的第一个参数.例如,定义一个 Person 类: class Person: def __init__(self): print("正在执行构造方法") # 定义一个study()实例方法 def study(self): print(self,"正在学Python") zhangsan = Person() zhangsan.study() lisi = Pers

  • Python argv用法详解

    想用python处理一下文件,发现有argv这个用法,搜来学习一下. 如果想对python脚步传参数,那么就需要命令行参数的支持了,这样可以省的每次去改脚步了. 用法是:python xx.py xxx 举例如下: #-*- coding:utf- -*- from sys import argv script,first = argv print "the script is called:", script print "the first variable is:&qu

  • Python 中 Virtualenv 和 pip 的简单用法详解

    本文介绍了Python 中 Virtualenv 和 pip 的简单用法详解,分享给大家,具体如下: 0X00 安装环境 我们在 Python 开发和学习过程中需要用到各种库,然后在各个不同的项目和作品里可能用的版本还不一样,正因为有这种问题的存在才催生了virtualenv的诞生.virtualenv 可以在电脑上创建一个虚拟环境,可以针对每一个项目创建一个虚拟环境,这样就不用担心各个不同的项目用不同版本的库的时候出现的冲突了. 下面的内容只适用于 Linux/OSX,未经 Windows 环

  • Python在信息学竞赛中的运用及Python的基本用法(详解)

    前言 众所周知,Python是一种非常实用的语言.但是由于其运算时的低效和解释型编译,在信息学竞赛中并不用于完成算法程序.但正如LRJ在<算法竞赛入门经典-训练指南>中所说的一样,如果会用Python,在进行一些小程序的编写,如数据生成器时将会非常方便,它的语法决定了其简约性.本文主要介绍一下简单的Python用法,不会深入. Python的安装和实用 Linux(以Ubuntu系统为例) 一般的Linux都自带了Python,在命令行中输入Python即可进入 如果没有出现上图的文字,可以使

  • Python中index()和seek()的用法(详解)

    1.index() 一般用处是在序列中检索参数并返回第一次出现的索引,没找到就会报错,比如: >>> t=tuple('Allen') >>> t ('A', 'l', 'l', 'e', 'n') >>> t.index('a') Traceback (most recent call last): File "<pyshell#2>", line 1, in <module> t.index('a') V

  • Python装饰器(decorator)定义与用法详解

    本文实例讲述了Python装饰器(decorator)定义与用法.分享给大家供大家参考,具体如下: 什么是装饰器(decorator) 简单来说,可以把装饰器理解为一个包装函数的函数,它一般将传入的函数或者是类做一定的处理,返回修改之后的对象.所以,我们能够在不修改原函数的基础上,在执行原函数前后执行别的代码.比较常用的场景有日志插入,事务处理等. 装饰器 最简单的函数,返回两个数的和 def calc_add(a, b): return a + b calc_add(1, 2) 但是现在又有新

  • 对python模块中多个类的用法详解

    如下所示: import wuhan.wuhan11 class Han: def __init__(self, config): self.batch_size = config.batch_size self.num_steps = config.num_steps class config: batch_size = 10 num_steps = 50 if __name__ == '__main__': han = Han(config) print(han.batch_size) pr

随机推荐