Python编程使用matplotlib挑钻石seaborn画图入门教程

目录
  • scatter_plot
  • lmplot
  • jointplot

挑钻石第二弹

seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True

scatter_plot

官方的示例就很不错,绘制了diamonds数据集中的钻石数据。diamonds中总共包含十项数据,分别是重量/克拉、切割水平、颜色、透明度、深度、table、价格以及x、y、z方向的尺寸。

我们可以先来看看xy方向的尺寸是否有一定的相关性

import seaborn as sns
import matplotlib.pyplot as plt
# 本地加载数据集
dia = sns.load_dataset("diamonds",data_home="seaborn-data", cache=True)
# 以上几行代码后面不再重复书写
sns.scatterplot(x=dia['x'],y=dia['y'],size=5)
plt.show()  #用于显示图片,后文就不写了

其中xy分别代表x轴和y轴数据,可见一般钻石还是比较规则的。

官方画廊绘制的图像如下

这个图的横坐标是重量(克拉),纵坐标是价格,我们发现钻石商人大多有强迫症,因为2.0克拉、1.5克拉、1.0克拉这种整十整五的钻石比周围重量的钻石更多。。。

f, ax = plt.subplots(figsize=(6.5, 6.5))
sns.set_theme(style="whitegrid")
sns.despine(f, left=True, bottom=True)
clarity =  ["I1", "SI2", "SI1", "VS2", "VS1", "VVS2", "VVS1", "IF"]   #颜色深浅的顺序
sns.scatterplot(x="carat", y="price",         #声明x轴和y轴的值
    hue="clarity", size="depth",  #clarity和depth分别调控颜色和尺寸
    palette="ch:rot=-.2,d=.3_r",    #调色板
    style_order=clarity,sizes=(1,10), #颜色标识的顺序和尺寸范围
    linewidth=0,data=dia, ax=ax)
plt.show()

首先,set_theme用于设置主题,其中style可以输入字符串或者字典,可调整主题风格。

其次,palette代表颜色映射,当其输入值为字符串时,其含义为

缩写 取值范围
start s [0,3] 渐变始点颜色
rot r 用于调控色相
gamma g 不小于0 小于1时,提高暗部;大于1时,加强高光
hue h [0,1] Saturation of the colors.
dark d [0,1] 最暗处的强度
light l [0,1] 最亮处颜色的强度

sizes用于调整点的尺寸,当设置size时,将size中的值对应到ssizes中从而绘图。

我们注意到钻石属性中有一个是切割水平,那么接下来绘制一下切割水平和价格的关系。

fig, ax = plt.subplots(figsize=(6.5, 6.5))
sns.set_theme(style="whitegrid")
sns.despine(fig, left=True, bottom=True)
sns.scatterplot(data = dia, x="carat", y="price",
    style="cut",hue='cut',
    linewidth=0)
plt.show()

果然把渐变颜色去掉之后颜值狂掉,但同时可以发现,这个very good显然不是最好的切割等级,毕竟在3.0克拉级别的钻石中,有一颗very good级别的钻石买到了最低价。GIA评估的钻石等级为Excellent,Very Good,Good,Fair到最差Poor,可能在这个数据集中,ideal就代表了Excellent吧。

lmplot

如果想更准确地观察cut对钻石价格的影响,可以通过lmplot在散点图的基础上绘制一个趋势线出来。

sns.lmplot(data=dia, x="carat", y="price",hue='cut',markers = '.')
plt.show()

这样一看就发现果然ideal的钻石是最好的。

jointplot

以上诸图,都是消费者最关心的问题——价格、尺寸以及透明度等。但商家最关心的可能是价格、重量与销售量的关系,这就涉及到一个分布的问题。而seaborn提供了一个非常好的双变量关系图——jointplot,效果如下

可见,还是便宜的钻石比较火爆,代码分别为

# 左图代码
sns.jointplot(data=dia, x="carat", y="price",xlim=(0,3),ylim=(0,17500), ratio=10,kind='hex',color="#4CB391")
# 右图代码
sns.jointplot(data=dia, x="carat", y="price",hue='cut', xlim=(0,3),ylim=(0,17500), ratio=10,marker='.')

其中,kind用于更改图像的风格,sns提供了六种风格:"scatter"   "kde"   "hist"    "hex"    "reg"     "resid"。

以上就是Python编程使用matplotlib挑钻石seaborn画图入门的详细内容,更多关于matplotlib挑钻石seaborn画图入门的资料请关注我们其它相关文章!

(0)

相关推荐

  • Python-Seaborn热图绘制的实现方法

    制图环境: pycharm python-3.6 Seaborn-0.8 热图 import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set() np.random.seed(0) uniform_data = np.random.rand(10, 12) ax = sns.heatmap(uniform_data) plt.show() # 改变颜色映射的值范围 ax = sns.heatmap

  • python中seaborn包常用图形使用详解

    seaborn包是对matplotlib的增强版,需要安装matplotlib后才能使用. 所有图形都用plt.show()来显示出来,也可以使用下面的创建画布 fig,ax=plt.subplots() #一个画布 fig,(ax1,ax2) = plt.subplots( ncols=2) #两个画布 1)单个特征统计图countplot sn.countplot(train.mnth)#离散型特征可使用,描述样本点出现的次数. 2)单个特征统计图distplot sn.distplot(t

  • Python数据可视化库seaborn的使用总结

    seaborn是python中的一个非常强大的数据可视化库,它集成了matplotlib,下图为seaborn的官网,如果遇到疑惑的地方可以到官网查看.http://seaborn.pydata.org/ 从官网的主页我们就可以看出,seaborn在数据可视化上真的非常强大. 1.首先我们还是需要先引入库,不过这次要用到的python库比较多. import numpy as np import pandas as pd import matplotlib as mpl import matpl

  • python Matplotlib数据可视化(1):简单入门

    1 matplot入门指南 matplotlib是Python科学计算中使用最多的一个可视化库,功能丰富,提供了非常多的可视化方案,基本能够满足各种场景下的数据可视化需求.但功能丰富从另一方面来说也意味着概念.方法.参数繁多,让许多新手望而却步. 据我了解,大部分人在对matplotlib接触不深时都是边画图边百度,诸如这类的问题,我想大家都似曾相识:Python如何画散点图,matplotlib怎么将坐标轴标签旋转45度,怎么设置图例字体大小等等.无论针对哪一个问题,往往都有多种解决方法,搜索

  • Python编程使用matplotlib挑钻石seaborn画图入门教程

    目录 scatter_plot lmplot jointplot 挑钻石第二弹 seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True. scatter_plot 官方的示例就很不错,绘制了diamonds数据集中的钻石数据.diamonds中总共包含十项数据,分别是重量/克拉.切割水平.颜色.透明度.深度.ta

  • Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图

    目录 箱线图 小提琴图 想不到大家都这么喜欢用python给女朋友挑钻石,所以我又写了个续. 如果看过之前一篇用python给女朋友挑钻石的文章,那么可以直接从箱线图开始读. seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True. 其中,diamonds数据集中包含了钻石数据,总计十项,分别是[重量/克拉]ca

  • Python中强大的命令行库click入门教程

    前言 我们的游戏资源处理工具是Python实现的,功能包括csv解析,UI材质处理,动画资源解析.批处理,Androd&iOS自动打包等功能.该项目是由其他部门继承过来的,由于绝大部分代码不符合我们的业务需求,所以进行了大重构.删除了所有业务代码,仅保留了python代码框架.项目中命令行参数解析是自己实现的,极其不优雅,也忍了这么久.打算找时间用click重写.所以最近学习了click,下面本文的内容是click的入门教程,初学者们可以来一起学习学习. 官网镜像地址: http://click

  • Python编程使用matplotlib绘制动态圆锥曲线示例

    目录 椭圆 双曲线 抛物线 极坐标方程 作为让高中生心脏骤停的四个字,对于高考之后的人来说可谓刻骨铭心,所以定义不再赘述,直接撸图,其标准方程分别为 在Python中,绘制动图需要用到matplotlib中的animation包,其调用方法以及接下来要用到的参数为 ani = animation.FuncAnimation(fig, func, frames, interval) 其中fig为绘图窗口,func为绘图函数,其返回值为图像,frames为迭代参数,如果为整型的话,其迭代参数则为ra

  • Python基于pyCUDA实现GPU加速并行计算功能入门教程

    本文实例讲述了Python基于pyCUDA实现GPU加速并行计算功能.分享给大家供大家参考,具体如下: Nvidia的CUDA 架构为我们提供了一种便捷的方式来直接操纵GPU 并进行编程,但是基于 C语言的CUDA实现较为复杂,开发周期较长.而python 作为一门广泛使用的语言,具有 简单易学.语法简单.开发迅速等优点.作为第四种CUDA支持语言,相信python一定会 在高性能计算上有杰出的贡献–pyCUDA. pyCUDA特点 CUDA完全的python实现 编码更为灵活.迅速.自适应调节

  • 在Python的Flask框架中使用模版的入门教程

     概述 如果你已经阅读过上一个章节,那么你应该已经完成了充分的准备工作并且创建了一个很简单的具有如下文件结构的Web应用:   microblog     |-flask文件夹     |-<一些虚拟环境的文件>     |-app文件夹     |  |-static文件夹     |  |-templates文件夹     |  |-__init__.py文件     |  |-views.py文件     |-tmp文件夹     |-run.py文件 亲,想要运行这个程序么?那就运行这

  • Python中一些自然语言工具的使用的入门教程

    NLTK 是使用 Python 教学以及实践计算语言学的极好工具.此外,计算语言学与人工 智能.语言/专门语言识别.翻译以及语法检查等领域关系密切. NLTK 包括什么 NLTK 会被自然地看作是具有栈结构的一系列层,这些层构建于彼此基础之上.那些熟悉人工语言(比如 Python)的文法 和解析的读者来说,理解自然语言模型中类似的 -- 但更深奥的 -- 层不会有太大困难. 术语表 全集(Corpora):相关文本的集合.例如,莎士比亚的作品可能被统称为一个 文集(corpus): 而若干个作者

  • python编程matplotlib交互绘制Julia集示例解析

    目录 Julia集 matplotlib绑定事件 缩放 所谓Julia集就是类似下面的美妙的图案 Julia集 特别地,当 c = z的初始值时,符合收敛条件的 z 的便构成大名鼎鼎的Mandelbrot集 在上图中,颜色表示该点的发散速度,可以理解为开始发散时迭代的次数.其生成代码也非常简单: #mbrot.py import numpy as np import time import pyplotlib.pyplot as plt #生成z坐标,axis为起始位置,nx,ny为x向和y向的

  • python必备库Matplotlib画图神器

    目录 1.安装方法 2.用好官网的例子 最简单的应用-折线图 添加注释的方法 柱状图-BarLabel 折线图之CSD 前言: Matplotlib 通常与 NumPy.Pandas 一起使用,是数据分析中不可或缺的重要工具之一. Matplotlib 是 Python 中类似 MATLAB 的绘图工具,如果您熟悉 MATLAB,那么可以很快的熟悉它.Matplotlib 提供了一套面向对象绘图的 API,它可以轻松地配合 Python GUI 工具包(比如 PyQt,WxPython.Tkin

  • python编程线性回归代码示例

    用python进行线性回归分析非常方便,有现成的库可以使用比如:numpy.linalog.lstsq例子.scipy.stats.linregress例子.pandas.ols例子等. 不过本文使用sklearn库的linear_model.LinearRegression,支持任意维度,非常好用. 一.二维直线的例子 预备知识:线性方程y=a∗x+b.y=a∗x+b表示平面一直线 下面的例子中,我们根据房屋面积.房屋价格的历史数据,建立线性回归模型. 然后,根据给出的房屋面积,来预测房屋价格

随机推荐