Pandas+Matplotlib 箱式图异常值分析示例
我就废话不多说了,直接上代码吧!
# -*- coding: utf-8 -*- import pandas as pd import matplotlib.pyplot as plt catering_sale = '../data/catering_sale.xls' data = pd.read_excel(catering_sale, index_col=u'日期') #指定日期列为索引,data类型为DataFrame plt.rcParams['font.sans-serif'] = ['SimHei'] #指定字体为黑体 plt.rcParams['axes.unicode_minus'] = False #显示负号 plt.figure() p = data.boxplot(return_type='dict') #画箱式图 x = p['fliers'][0].get_xdata() #fliers为异常值标签,get_xdata()与get_ydata()用来获取横纵坐标数组 y = p['fliers'][0].get_ydata() y.sort() #使用annotate添加注释,xy表示标注点坐标, xytext表示注释坐标 for i in range(len(x)): if i > 0: plt.annotate(y[i], xy=(x[i], y[i]), xytext=(x[i]+0.05 - 0.8/(y[i]-y[i-1]), y[i])) else: plt.annotate(y[i], xy=(x[i], y[i]), xytext=(x[i]+0.08, y[i])) plt.show()
以上这篇Pandas+Matplotlib 箱式图异常值分析示例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
python实现数据清洗(缺失值与异常值处理)
1. 将本地sql文件写入mysql数据库 本文写入的是python数据库的taob表 source [本地文件] 其中总数据为9616行,列分别为title,link,price,comment 2.使用python链接并读取数据 查看数据概括 #-*- coding:utf-8 -*- #author:M10 import numpy as np import pandas as pd import matplotlib.pylab as plt import mysql.connector
-
Python使用matplotlib和pandas实现的画图操作【经典示例】
本文实例讲述了Python使用matplotlib和pandas实现的画图操作.分享给大家供大家参考,具体如下: 画图在工作再所难免,尤其在做数据探索时候,下面总结了一些关于python画图的例子 #encoding:utf-8 ''''' Created on 2015年9月11日 @author: ZHOUMEIXU204 ''' # pylab 是 matplotlib 面向对象绘图库的一个接口.它的语法和 Matlab 十分相近 import pandas as pd #from ggp
-
Python数据分析pandas模块用法实例详解
本文实例讲述了Python数据分析pandas模块用法.分享给大家供大家参考,具体如下: pandas pandas10分钟入门,可以查看官网:10 minutes to pandas 也可以查看更复杂的cookbook pandas是非常强大的数据分析包,pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包.就好比 Numpy的核心是 ndarray,pandas 围绕着 Series 和 DataFrame 两个核心数据结构展开 .Series和DataFrame 分
-
Pandas+Matplotlib 箱式图异常值分析示例
我就废话不多说了,直接上代码吧! # -*- coding: utf-8 -*- import pandas as pd import matplotlib.pyplot as plt catering_sale = '../data/catering_sale.xls' data = pd.read_excel(catering_sale, index_col=u'日期') #指定日期列为索引,data类型为DataFrame plt.rcParams['font.sans-serif'] =
-
利用Python进行异常值分析实例代码
前言 异常值是指样本中的个别值,也称为离群点,其数值明显偏离其余的观测值.常用检测方法3σ原则和箱型图.其中,3σ原则只适用服从正态分布的数据.在3σ原则下,异常值被定义为观察值和平均值的偏差超过3倍标准差的值.P(|x−μ|>3σ)≤0.003,在正太分布假设下,大于3σ的值出现的概率小于0.003,属于小概率事件,故可认定其为异常值. 异常值分析是检验数据是否有录入错误以及含有不合常理的数据.忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响:重
-
Matplotlib 折线图plot()所有用法详解
散点图和折线图是数据分析中最常用的两种图形.其中,折线图用于分析自变量和因变量之间的趋势关系,最适合用于显示随着时间而变化的连续数据,同时还可以看出数量的差异,增长情况. Matplotlib 中绘制散点图的函数为 plot() ,使用语法如下:matplotlib.pyplot.plot(*args, scalex=True, scaley=True, data=None, **kwargs) 常用参数及说明: 参数 接收值 说明 默认值 x,y array 表示 x 轴与 y 轴对应的数据:
-
Python数据分析之 Matplotlib 折线图绘制
目录 一.Matplotlib 绘图 简单示例 二.折线图绘制 一.Matplotlib 绘图 在数据分析中,数据可视化也非常重要,通过直观的展示过程.结果数据,可以帮助我们清晰的理解数据,进而更好的进行分析.接下来就说一下Python数据分析中的数据可视化工具 Matplotlib 库. Matplotlib 是一个非常强大的Python 2D绘图库,使用它,我们可以通过图表的形式更直观的展现数据,实现数据可视化,使用起来也非常方便,而且支持绘制折线图.柱状图.饼图.直方图.散点图等. 可以使
-
Python实现读取txt文件并画三维图简单代码示例
记忆力差的孩子得勤做笔记! 刚接触python,最近又需要画一个三维图,然后就找了一大堆资料,看的人头昏脑胀的,今天终于解决了!好了,废话不多说,直接上代码! #由三个一维坐标画三维散点 #coding:utf-8 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d.axes3d import Axes3D x = [] y = [] z = [] f = open("data\\record.
-
用matplotlib画等高线图详解
等高线图是在地理课中讲述山峰山谷时绘制的图形,在机器学习中也会被用在绘制梯度下降算法的图形中. 因为等高线的图有三个信息:x,y以及x,y所对应的高度值. 这个高度值的计算我们用一个函数来表述: 计算x,y坐标对应的高度值 def f(x, y): return (1-x/2+x**5+y**3) * np.exp(-x**2-y**2) 这个函数看起来挺复杂的,但我们这里只是为了能够获得一个高度值,因此其中函数代表什么意义不用关心,只要知道输入一个x,y,输出一个高度值就可以了. 要画出等高线
-
Python使用matplotlib绘制余弦的散点图示例
本文实例讲述了Python使用matplotlib绘制余弦的散点图.分享给大家供大家参考,具体如下: 一 代码 import numpy as np import pylab as pl a = np.arange(0,2.0*np.pi,0.1) b = np.cos(a) #绘制散点图 pl.scatter(a,b) pl.show() 二 运行结果 三 修改散点符号代码 import numpy as np import pylab as pl a = np.arange(0,2.0*np
-
python matplotlib折线图样式实现过程
这篇文章主要介绍了python matplotlib折线图样式实现过程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 一:简单的折线图 import matplotlib.pyplot as plt #支持中文显示 plt.rcParams["font.sans-serif"]=["SimHei"] #x,y数据 x_data = [1,2,3,4,5] y_data = [10,30,20,25,28] plt.
-
Python可视化Matplotlib折线图plot用法详解
目录 1.完善原始折线图 - 给图形添加辅助功能 1.1 准备数据并画出初始折线图 1.2 添加自定义x,y刻度 1.3 中文显示问题解决 1.4 添加网格显示 1.5 添加描述信息 1.6 图像保存 2. 在一个坐标系中绘制多个图像 2.1 多次plot 2.2 显示图例 2.3 折线图的应用场景 折线图是数据分析中非常常用的图形.其中,折线图主要是以折线的上升或下降来表示统计数量的增减变化的统计图.用于分析自变量和因变量之间的趋势关系,最适合用于显示随着时间而变化的连续数据,同时还可以看出数
-
python编程matplotlib交互绘制Julia集示例解析
目录 Julia集 matplotlib绑定事件 缩放 所谓Julia集就是类似下面的美妙的图案 Julia集 特别地,当 c = z的初始值时,符合收敛条件的 z 的便构成大名鼎鼎的Mandelbrot集 在上图中,颜色表示该点的发散速度,可以理解为开始发散时迭代的次数.其生成代码也非常简单: #mbrot.py import numpy as np import time import pyplotlib.pyplot as plt #生成z坐标,axis为起始位置,nx,ny为x向和y向的
随机推荐
- 防止网站内容被拷贝的一些方法与优缺点好处与坏处分析
- js+html5通过canvas指定开始和结束点绘制线条的方法
- asp.net 大文件上传控件
- 有关PHP性能优化的介绍
- C与C++中结构体的区别
- c#编写webservice服务引用实例分享
- Bootstrap图片轮播组件使用实例解析
- 从外部的js文件中获取ASPX页面的控件ClientID
- php版小黄鸡simsimi聊天机器人接口分享
- Python重新引入被覆盖的自带function
- 微信浏览器禁止页面下拉查看网址实例详解
- 浅析Node在构建超媒体API中的作用
- js图片翻书效果代码分享
- PHP 5 数据对象 (PDO) 抽象层与 Oracle
- C#算法设计之关于1000瓶水的问题
- 新云管理系统3.0版 Google地图生成器提供了,测试了,好用
- C#数字图象处理之图像灰度化方法
- Spring Boot整合elasticsearch的详细步骤
- Python动态参数/命名空间/函数嵌套/global和nonlocal
- 在laravel中实现事务回滚的方法