Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图
目录
- 箱线图
- 小提琴图
想不到大家都这么喜欢用python给女朋友挑钻石,所以我又写了个续。
如果看过之前一篇用python给女朋友挑钻石的文章,那么可以直接从箱线图开始读。
seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()
进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache
设为True
。
其中,diamonds
数据集中包含了钻石数据,总计十项,分别是[重量/克拉]carat
、切割水平cut
、颜色color
、透明度clarity
、深度depth
、table
、价格price
以及x
、y
、z
方向的尺寸。
画图第一步就是导入包和数据。
import seaborn as sns import matplotlib.pyplot as plt # 本地加载数据集 dia = sns.load_dataset("diamonds",data_home="seaborn-data", cache=True) # 以上几行代码后面不再重复书写
箱线图
现在我们想知道Premium, Fair, Very Good, Good, Ideal这五种切割方式所对应的价格区间,那么最直接的想法是做一个箱线图,就类似K线那种图。
这个图中,箱和线描述了五个统计量:最小非异常值、第一四分位数(25%)、中位数、第三四分位数(75%)以及非异常最大值。而最大值上面的那些点,则为异常值。可见,超过1.5万刀的钻石属于异类。
>>> sns.boxplot(x="cut",y="price",data=dia,color='lightblue',fliersize=0.25) >>> plt.show()
其中,fliersize
表示异常值的尺寸。
增强箱线图
箱线图尽管已经可以描述一定的分布特性,但是还不够,毕竟只有5个统计量。
sns中提供了增强版的箱线图:boxenplot
在这个图中,将价格区间进行了划分,每个价格区间中,箱子越宽则代表样本越多。
sns.boxenplot(x="cut",y="price",data=dia, palette="ch:rot=-.5,d=.3_r") plt.show()
小提琴图
如果想再细致一点,那么就得用小提琴图了
sns.violinplot(x="cut",y="price",data=dia) sns.despine(left=True)
这样一看,切割最好的钻石,价格区间竟然以1000左右为主,尽管离谱,但也很真实了。
以上就是Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图的详细内容,更多关于matplotlib挑钻石seaborn小提琴和箱线图的资料请关注我们其它相关文章!
相关推荐
-
Python数据分析之绘图和可视化详解
一.前言 matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面).该项目是由John Hunter于2002年启动的,其目的是为Python构建一个MATLAB式的绘图接口.matplotlib和IPython社区进行合作,简化了从IPython shell(包括现在的Jupyter notebook)进行交互式绘图.matplotlib支持各种操作系统上许多不同的GUI后端,而且还能将图片导出为各种常见的矢量(vector)和光栅(raster)图:PDF.SVG.JPG
-
Python数据可视化库seaborn的使用总结
seaborn是python中的一个非常强大的数据可视化库,它集成了matplotlib,下图为seaborn的官网,如果遇到疑惑的地方可以到官网查看.http://seaborn.pydata.org/ 从官网的主页我们就可以看出,seaborn在数据可视化上真的非常强大. 1.首先我们还是需要先引入库,不过这次要用到的python库比较多. import numpy as np import pandas as pd import matplotlib as mpl import matpl
-
Python数据可视化常用4大绘图库原理详解
今天我们就用一篇文章,带大家梳理matplotlib.seaborn.plotly.pyecharts的绘图原理,让大家学起来不再那么费劲! 1. matplotlib绘图原理 关于matplotlib更详细的绘图说明,大家可以参考下面这篇文章,相信你看了以后一定学得会. matplotlib绘图原理:http://suo.im/678FCo 1)绘图原理说明 通过我自己的学习和理解,我将matplotlib绘图原理高度总结为如下几步: 导库;创建figure画布对象;获取对应位置的axes坐标
-
python Plotly绘图工具的简单使用
1.plotly库的相关介绍 1)相关说明 plotly是一个基于javascript的绘图库,plotly绘图种类丰富,效果美观: 易于保存与分享plotly的绘图结果,并且可以与Web无缝集成: ploty默认的绘图结果,是一个HTML网页文件,通过浏览器可以直接查看: 2)plotly与matplotlib.seaborn的关系 需要注意的是,ployly绘图库与matplotlib绘图库.seaborn绘图库并没有什么关系.也就是说说plotly是一个单独的绘图库,有自己独特的绘图语
-
Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图
目录 箱线图 小提琴图 想不到大家都这么喜欢用python给女朋友挑钻石,所以我又写了个续. 如果看过之前一篇用python给女朋友挑钻石的文章,那么可以直接从箱线图开始读. seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True. 其中,diamonds数据集中包含了钻石数据,总计十项,分别是[重量/克拉]ca
-
Python编程使用matplotlib挑钻石seaborn画图入门教程
目录 scatter_plot lmplot jointplot 挑钻石第二弹 seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True. scatter_plot 官方的示例就很不错,绘制了diamonds数据集中的钻石数据.diamonds中总共包含十项数据,分别是重量/克拉.切割水平.颜色.透明度.深度.ta
-
python使用Matplotlib绘图及设置实例(用python制图)
目录 一.初识matplotlib.pyplot 1.绘制图像 2.设置图片大小 3.保存图片文件 4.设置X,Y轴刻度范围 5.添加描述信息(标题.轴标签) 6.设置显示中文(导入字体模块) 7.绘制网格 二.常见绘图属性设置 1.绘图符号(Makers) 2.线型(Line Styles) 3.颜色缩写(Colors) 4.Windows字体中英文名称对照 面向对象方式绘图 配置对象的属性 绘制多个子图 三.Artist对象 Artist对象进行绘图的流程 设置Artist属性 一些例子 F
-
Python使用matplotlib绘图无法显示中文问题的解决方法
本文实例讲述了Python使用matplotlib绘图无法显示中文问题的解决方法.分享给大家供大家参考,具体如下: 在python中,默认情况下是无法显示中文的,如下代码: import matplotlib.pyplot as plt # 定义文本框和箭头格式 decisionNode = dict(boxstyle = "sawtooth", fc = "0.8") leafNode = dict(boxstyle = "round4", f
-
Python编程pygal绘图实例之XY线
安装pygal,可参阅:pip和pygal的安装实例教程 基本XY线: import pygal from math import cos """ XY线是将各个点用直线连接起来的折线图 需提供一个横纵坐标元组作为元素的列表 """ xy_chart = pygal.XY() xy_chart.title = 'XY Cosinus' xy_chart.add('x = cos(y)', [(cos(x / 10.), x / 10.) for
-
python编程matplotlib交互绘制Julia集示例解析
目录 Julia集 matplotlib绑定事件 缩放 所谓Julia集就是类似下面的美妙的图案 Julia集 特别地,当 c = z的初始值时,符合收敛条件的 z 的便构成大名鼎鼎的Mandelbrot集 在上图中,颜色表示该点的发散速度,可以理解为开始发散时迭代的次数.其生成代码也非常简单: #mbrot.py import numpy as np import time import pyplotlib.pyplot as plt #生成z坐标,axis为起始位置,nx,ny为x向和y向的
-
Python利用Matplotlib绘图无法显示中文字体的解决方案
目录 发现问题 解决方式: 总结 发现问题 我在利用Pycharm中的matplotlib库进行绘图的时候,出现了一个问题,当我将所绘的图的横,纵坐标,希望加上一个中文描述的时候,比如,'横坐标','纵坐标'类似这样的描述方法.出现了很多人都会出现的一个问题. import matplotlib.pyplot as plt squares = [1, 4, 9, 16, 25] fig, ax = plt.subplots() ax.plot(squares, linewidth=3) #设置图
-
用python的seaborn画数值箱型图
目录 一.概念介绍 二.数据展示 三.数据导入 四.画图 总结 一.概念介绍 箱型图(box-plot),又称为箱线图,盒型图,盒须图.在数据探索阶段或者描述性分析过程中,我们常常用于展示多类连续型数据的数值分布情况,便于类间对比和快速识别异常值. 在一幅箱型图中,一个连续数值序列构成一个盒子,如下所示. 每一个盒子主要展示的是数据的上四分位数Q1(25%),中位数(50%),下四分位数Q3(75%).划分异常值的界限我们称为上下极限,其离Q1,Q3分别是1.5IQR(IQR=Q3-Q1,称作四
-
Python数据可视化:箱线图多种库画法
概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q3)分别为数据的第25%,50%和75%的数字. 四分位间距(Interquartilerange(IQR))=上分位数(upper quartile)-下分位数(lower quartile) 箱线图分为两部分,分别是箱(box)和须(whisker).箱(box)用来表示从第一分位到第三分位的数
-
Python pyecharts Boxplot箱线图的实现
本篇博客只是单纯的记录一下自己学习Boxplot,没有过多的解释,官网:>>Boxplot import seaborn as sns import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif']=['Microsoft YaHei'] # 用来正常显示中文标签 p
随机推荐
- 不错的rss看样要学习了
- JAVA技术实现上传下载文件到FTP服务器(完整)
- 解析php通过cookies获取远程网页的指定代码
- PHP在网页中动态生成PDF文件详细教程
- js实现文字截断功能
- CSS顶级技巧大放送,div+css布局必知
- DIV CSS网页布局 最小高度(min-height)的妙用
- 给XML文档添加新 ”records”
- Linux系统中如何实现远程控制
- java实现一个简单TCPSocket聊天室功能分享
- SQL Server 交叉表查询 case
- jquery刷新页面的实现代码(局部及全页面刷新)
- 借用Google的Javascript API Loader来加速你的网站
- table 隔列(行)换色效果让表格结构更清淅
- javascript fullscreen全屏实现代码
- 阿里云主机Windows 2008服务器硬盘分区和格式化图文教程
- 什么是DAO Database Access Object
- STL priority_queue(优先队列)详解
- c#求两个数中最大值的方法
- windows Server 2008R2 FTP服务器搭建图文教程