Pandas中八个常用option设置的示例详解

目录
  • 前言
  • 1. 显示更多行
  • 2. 显示更多列
  • 3. 改变列宽
  • 4. 设置float列的精度
  • 5. 数字格式化显示
    • 用逗号格式化大值数字
    • 设置数字精度
    • 百分号格式化
  • 6. 更改绘图方法
  • 7. 配置info()的输出
  • 8. 打印出当前设置并重置所有选项

前言

通过pandas的使用,我们经常要交互式地展示表格(dataframe)、分析表格。而表格的格式就显得尤为重要了,因为大部分时候如果我们直接展示表格,格式并不是很友好。

其实呢,这些痛点都可以通过pandas的option来解决。短短几行代码,只要提前配置好,一次设置好,全局生效,perfect!

# 使用方法
import pandas as pd
pd.set_option()
pd.get_option()
# 使用属性,例如展示的最大行数
pd.option.display.max_rows

东哥整理了8个常用的配置选项,供大家参考。记住这8个option代码,下次直接粘贴进去,效率可以提高很多,爽歪歪。

  • 显示更多行
  • 显示更多列
  • 改变列宽
  • 设置float列的精度
  • 数字格式化显示
  • 更改绘图方法
  • 配置info()的输出
  • 打印出当前设置并重置所有选项

1. 显示更多行

默认情况下,pandas 是不超出屏幕的显示范围的,如果表的行数很多,它会截断中间的行只显示一部分。我们可以通过设置display.max_rows来控制显示的最大行数,比如我想设置显示200行。

pd.set_option('display.max_rows', 200)
# pd.options.display.max_rows = 200

如果行数超过了display.max_rows,那么display.min_rows将确定显示的部分有多少行。因为display.min_rows的默认行数为5,,下面例子只显示前5行和最后5行,中间的所有行省略。

同理,也可根据自己的习惯显示可显示的行数,比如10, 20..

pd.set_option('display.min_rows', 10)
# pd.options.display.min_rows = 10

还可以直接重置。

# 重置
pd.reset_option('display.max_rows')

2. 显示更多列

行可以设置,同样的列也可以设置,display.max_columns控制着可显示的列数,默认值为20。

pd.get_option('display.max_columns')
# pd.options.display.max_columns
20

3. 改变列宽

pandas对列中显示的字符数有一些限制,默认值为50字符。所以,有的值字符过长就会显示省略号。如果想全部显示,可以设置display.max_colwidth,比如设置成500。

pd.set_option ('display.max_colwidth',500)
# pd.options.display.max_colwidth = 500

4. 设置float列的精度

对于float浮点型数据,pandas默认情况下只显示小数点后6位。我们可以通过预先设置display.precision让其只显示2位,避免后面重复操作。

pd.set_option( 'display.precision',2)
# pd.options.display.precision = 2

这个设置不影响底层数据,它只影响浮动列的显示。

5. 数字格式化显示

pandas中有一个选项display.float_formatoption可以用来格式化任何浮点列。这个仅适用于浮点列,对于其他数据类型,必须将它们转换为浮点数才可以。

用逗号格式化大值数字

例如 1200000 这样的大数字看起来很不方便,所以我们用逗号进行分隔。

pd.set_option('display.float_format','{:,}'.format)

设置数字精度

和上面display.precision有点类似,假如我们只关心小数点后的2位数字,我们可以这样设置格式化:

pd.set_option('display.float_format',  '{:,.2f}'.format)

百分号格式化

如果我们要显示一个百分比的列,可以这样设置。

pd.set_option('display.float_format', '{:.2f}%'.format)

或者其它币种的符号等均可,只需要在大括号{}前后添加即可。

6. 更改绘图方法

默认情况下,pandas使用matplotlib作为绘图后端。从 0.25 版本开始,pandas提供了使用不同后端选择,比如plotly,bokeh等第三方库,但前提是你需要先安装起来。

设置很简单,只要安装好三方库后,同样只需要一行。

import pandas as pd
import numpy as np
pd.set_option('plotting.backend', 'altair')
data = pd.Series(np.random.randn(100).cumsum())
data.plot()

7. 配置info()的输出

pandas中我们经常要使用info()来快速查看DataFrame的数据情况。但是,info这个方法对要分析的最大列数是有默认限制的,并且如果数据集中有null,那么在大数据集计数统计时会非常慢。

pandas提供了两种选择:

  • display.max_info_columns: 设置要分析的最大列数,默认为100。
  • display.max_info_rows: 设置计数null时的阈值,默认为1690785。

比如,在分析有 150 个特征的数据集时,我们可以设置display.max_info_columns为涵盖所有列的值,比如将其设置为 200:

pd.set_option('display.max_info_columns', 200)

在分析大型数据集时,df.info()由于要计算所有null,导致速度很慢。因此我们可以简单地设置display.max_info_rows为一个小的值来避免计数,例如只在行数不超过5时才计数null:

pd.set_option('display.max_info_rows', 5)

8. 打印出当前设置并重置所有选项

pd.describe_option()将打印出设置的描述及其当前值。

pd.describe_option()

还可以打印特定的选项,例如,行显示。

# 具体的搜索
pd.describe_option('rows')

最后,我们还可以直接全部重置。

pd.reset_option('all')

以上就是8个常用set_option的使用,下面进行了汇总,方便大家粘贴使用。

pd.set_option('display.max_rows',xxx) # 最大行数
pd.set_option('display.min_rows',xxx) # 最小显示行数
pd.set_option('display.max_columns',xxx) # 最大显示列数
pd.set_option ('display.max_colwidth',xxx) #最大列字符数
pd.set_option( 'display.precision',2) # 浮点型精度
pd.set_option('display.float_format','{:,}'.format) #逗号分隔数字
pd.set_option('display.float_format',  '{:,.2f}'.format) #设置浮点精度
pd.set_option('display.float_format', '{:.2f}%'.format) #百分号格式化
pd.set_option('plotting.backend', 'altair') # 更改后端绘图方式
pd.set_option('display.max_info_columns', 200) # info输出最大列数
pd.set_option('display.max_info_rows', 5) # info计数null时的阈值
pd.describe_option() #展示所有设置和描述
pd.reset_option('all') #重置所有设置选项

以上就是Pandas中八个常用option设置的示例详解的详细内容,更多关于Pandas option设置的资料请关注我们其它相关文章!

(0)

相关推荐

  • Pandas自定义选项option设置

    目录 简介 常用选项 get/set 选项 经常使用的选项 最大展示行数 超出数据展示 最大列的宽度 显示精度 零转换的门槛 列头的对齐方向 简介 pandas有一个option系统可以控制pandas的展示情况,一般来说我们不需要进行修改,但是不排除特殊情况下的修改需求.本文将会详细讲解pandas中的option设置. 常用选项 pd.options.display 可以控制展示选项,比如设置最大展示行数: In [1]: import pandas as pd In [2]: pd.opt

  • 分享8 个常用pandas的 index设置

    目录 1. 将索引从 groupby 操作转换为列 2. 使用现有的 DataFrame 设置索引 3. 一些操作后重置索引 4.排序后重置索引 5.删除重复后重置索引 6. 索引的直接赋值 7.写入CSV文件时忽略索引 8.读取时指定索引列 1. 将索引从 groupby 操作转换为列 groupby分组方法是经常用的.比如下面通过添加一个分组列team来进行分组. >>> df0["team"] = ["X", "X", &

  • pandas参数设置的实用小技巧

    前言 在日常使用pandas的过程中,由于我们所分析的数据表规模.格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异. 而pandas有着自己的一套参数设置系统,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识. 图1 1 设置DataFrame最大显示行数 pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子:

  • Pandas中八个常用option设置的示例详解

    目录 前言 1. 显示更多行 2. 显示更多列 3. 改变列宽 4. 设置float列的精度 5. 数字格式化显示 用逗号格式化大值数字 设置数字精度 百分号格式化 6. 更改绘图方法 7. 配置info()的输出 8. 打印出当前设置并重置所有选项 前言 通过pandas的使用,我们经常要交互式地展示表格(dataframe).分析表格.而表格的格式就显得尤为重要了,因为大部分时候如果我们直接展示表格,格式并不是很友好. 其实呢,这些痛点都可以通过pandas的option来解决.短短几行代码

  • 微信小程序中button组件的边框设置的实例详解

    微信小程序中button组件的边框设置的实例详解 button的边框是用:after方式实现的,用户如果在button上定义边框会出现两条线,需用:after的方式去覆盖默认值. 如果设置了Button的背景色,没有用:after设置边框的颜色,则button的四个角会出现模糊的尖角.如下图所示: 如上图四个角会模糊..wxss代码如下: .clickEncryptBtn{ width:130px; border-radius: 3px; margin:20px auto; padding-to

  • Python Pandas中合并数据的5个函数使用详解

    目录 join 索引一致 索引不一致 merge concat 纵向拼接 横向拼接 append combine 前几天在一个群里面,看到一位朋友,说到自己的阿里面试,被问了一些关于pandas的使用.其中一个问题是:pandas中合并数据的5中方法. 今天借着这个机会,就为大家盘点一下pandas中合并数据的5个函数.但是对于每个函数,我这里不打算详细说明,具体用法大家可以参考pandas官当文档. join主要用于基于索引的横向合并拼接: merge主要用于基于指定列的横向合并拼接: con

  • JavaScript中数组去重常用的五种方法详解

    目录 1.对象属性(indexof) 2.new Set(数组) 3.new Map() 4.filter() + indexof 5.reduce() + includes 补充 原数组 const arr = [1, 1, '1', 17, true, true, false, false, 'true', 'a', {}, {}]; 1.对象属性(indexof) 利用对象属性key排除重复项 遍历数组,每次判断新数组中是否存在该属性,不存在就存储在新数组中 并把数组元素作为key,最后返

  • java中常见的6种线程池示例详解

    之前我们介绍了线程池的四种拒绝策略,了解了线程池参数的含义,那么今天我们来聊聊Java 中常见的几种线程池,以及在jdk7 加入的 ForkJoin 新型线程池 首先我们列出Java 中的六种线程池如下 线程池名称 描述 FixedThreadPool 核心线程数与最大线程数相同 SingleThreadExecutor 一个线程的线程池 CachedThreadPool 核心线程为0,最大线程数为Integer. MAX_VALUE ScheduledThreadPool 指定核心线程数的定时

  • .NET 中配置从xml转向json方法示例详解

    目录 一.配置概述 二.配置初识 三.选项模式 四.选项依赖注入 五.其它配置 六.托管模式 一.配置概述 在.net framework平台中我们常见的也是最熟悉的就是.config文件作为配置,控制台桌面程序是App.config,Web就是web.config,里面的配置格式为xml格式. 在xml里面有系统生成的配置项,也有我们自己添加的一些配置,最常用的就是appSettings节点,用来配置数据库连接和参数. 使用的话就引用包System.Configuration.Configur

  • JavaScript中自带的 reduce()方法使用示例详解

    1.方法说明 , Array的reduce()把一个函数作用在这个Array的[x1, x2, x3...]上,这个函数必须接收两个参数,reduce()把结果继续和序列的下一个元素做累积计算,其效果就是: [x1, x2, x3, x4].reduce(f) = f(f(f(x1, x2), x3), x4) 2. 使用示例 'use strict'; function string2int(s){ if(!s){ alert('the params empty'); return; } if

  • JavaScript中的ajax功能的概念和示例详解

    AJAX即"Asynchronous Javascript And XML"(异步JavaScript和XML). 个人理解:ajax就是无刷新提交,然后得到返回内容. 对应的不使用ajax时的传统网页如果需要更新内容(或用php做处理时),必须重载整个网页页面. 示例: html代码如下 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>

  • 对Python3中列表乘以某一个数的示例详解

    在Python列表操作中:列表乘以某一个数,如list2 = list1 * 2 得到一个新的列表是list1的元素重复n次,且list1不改变. 但运行如下代码时,得到的新列表b中,b[0]和b[1]的地址相同,即对b[0]进行操作,b[1]也会发生改变. a = [0] b = [a] * 2 print(b) b[0].append(1) print(b) 输出为: [[0], [0]] [[0, 1], [0, 1]] 随后尝试以下几种代码: 代码(1) a = [0] b = [a f

  • Django中的模型类设计及展示示例详解

    django中设计数据模型类是基于ORM的对象关系映射更方便的进行数据库中的数据操作. 对象关系映射 把面向对象中的类和数据库表--对应,通过操作类和对象,对数表实现数据操作,不需要写sql,由ORM框架生成 django实现了ORM框架,在项目中与数据库之间产生桥梁作用 django数据库定义模型的步骤如下: python manage.py makemigrations python mange.py migrate 在应用models.py中编写模型类,继承models.Model类 在模

随机推荐