pandas学习之df.fillna的具体使用

目录
  • 构建实例:
  • value:scalar,series,dict,dataframe
  • method:{backfill,bfill,pad,ffill,none},default none

df.fillna主要用来对缺失值进行填充,可以选择填充具体的数字,或者选择临近填充。

官方文档

DataFrame.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

解释

构建实例:

import numpy as np
import pandas as pd
df = pd.DataFrame([[np.nan,22,23,np.nan],[31,np.nan,12,34],[np.nan,np.nan,np.nan,23],
[15,17,66,np.nan]],columns=list('ABCD'))
df

    A        B        C        D
0    NaN        22.0    23.0    NaN
1    31.0    NaN        12.0    34.0
2    NaN        NaN        NaN        23.0
3    15.0    17.0    66.0    NaN

value:scalar,series,dict,dataframe

填充的值,可以是一个标量,或者字典等

df.fillna(value=1)#缺失值填充为1
    A        B        C        D
0    1.0        22.0    23.0    1.0
1    31.0    1.0        12.0    34.0
2    1.0        1.0        1.0        23.0
3    15.0    17.0    66.0    1.0
------------------------------------------
df.fillna(value={'A':2,'B':3})# 传入一个字典,指定某列填充的具体值
    A        B        C        D
0    2.0        22.0    23.0    NaN
1    31.0    3.0        12.0    34.0
2    2.0        3.0        NaN        23.0
3    15.0    17.0    66.0    NaN

method:{backfill,bfill,pad,ffill,none},default none

填充的方法,backfill和bfill代表填充后侧值,ffill和pad填充空值前侧值

df.fillna(method='ffill')#向前填充,注意此处默认参数axis=0,所以空值是填充上一行的数据,而不是前一列。

    A        B        C        D
0    NaN        22.0    23.0    NaN
1    31.0    22.0    12.0    34.0
2    31.0    22.0    12.0    23.0
3    15.0    17.0    66.0    23.0

axis:
控制行列的参数,用法和其他方法完全相同

inplace:
是否将结果赋值给原变量,和其他方法里的用法相同

limit:int 或None
向前或后填充的最大数量,必须是大于0的整数
如果指定了method参数,则连续空值值填充前int个
如果未指定method参数,则只填充所在轴上的前int空值

    A        B        C        D#原数据
0    NaN        22.0    23.0    NaN
1    31.0    NaN        12.0    34.0
2    NaN        NaN        NaN        23.0
3    15.0    17.0    66.0    NaN

df.fillna(value=0,axis=1,limit=1)#在ABCD列上,每列只填充第一个空值
    A        B        C        D
0    0.0        22.0    23.0    0.0
1    31.0    0.0        12.0    34.0
2    NaN        NaN        0.0        23.0
3    15.0    17.0    66.0    NaN

到此这篇关于pandas学习之df.fillna的具体使用的文章就介绍到这了,更多相关pandas df.fillna内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Pandas缺失值填充 df.fillna()的实现

    df.fillna主要用来对缺失值进行填充,可以选择填充具体的数字,或者选择临近填充. 官方文档 DataFrame.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None) df.fillna(x)可以将缺失值填充为指定的值 import pandas as pd # 原数据 df = pd.DataFrame({'A':['a1','a1','a2','a2'], 'B

  • pandas学习之df.fillna的具体使用

    目录 构建实例: value:scalar,series,dict,dataframe method:{backfill,bfill,pad,ffill,none},default none df.fillna主要用来对缺失值进行填充,可以选择填充具体的数字,或者选择临近填充. 官方文档 DataFrame.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None) 解释 构

  • pandas学习之df.set_index的具体使用

    目录 构建实例 key:label array-like or list of label/arrays drop:bool,default True append:bool default False inplace:bool default False verify_integrity:bool default False 处理数据时,经常需要对索引进行处理,那么可以通过set_index和reset_index来进行处理 官方文档 DataFrame.set_index(self, key

  • python数学建模之Numpy 应用介绍与Pandas学习

    目录 Numpy学习 1 Numpy 介绍与应用 1-1Numpy是什么 2 NumPy Ndarray 对象 3 Numpy 数据类型 4 Numpy 数组属性 Pandas学习 1 pandas新增数据列 2 Pandas数据统计函数 3 Pandas对缺失值的处理 总结 Numpy学习 1 Numpy 介绍与应用 1-1Numpy是什么 NumPy 是一个运行速度非常快的数学库,一个开源的的python科学计算库,主要用于数组.矩阵计算,包含: 一个强大的N维数组对象 ndarray广播功

  • pandas学习之txt与sql文件的基本操作指南

    目录 前言 1.导入txt文件 2.导入sql文件 2.1 安装依赖库pymysql 3.小结 总结 前言 Pandas是python的一个数据分析包,是基于NumPy的一种工具提供了大量数据结构和函数,可以很方便的处理结构化数据,常见数据结构有: Series:一维数组,与Numpy中的一维array类似. DataFrame:二维的表格型数据结构,可以将DataFrame理解为Series的容器 Time- Series:以时间为索引的Series Panel :三维的数组,可以理解为Dat

  • Python Pandas学习之基本数据操作详解

    目录 1索引操作 1.1直接使用行列索引(先列后行) 1.2结合loc或者iloc使用索引 1.3使用ix组合索引 2赋值操作 3排序 3.1DataFrame排序 3.2Series排序 为了更好的理解这些基本操作,下面会通过读取一个股票数据,来进行Pandas基本数据操作的语法介绍. # 读取文件(读取保存文件后面会专门进行讲解,这里先直接调用下api) data = pd.read_csv("./data/stock_day.csv")  # 读取当前目录下一个csv文件 # 删

  • Python Pandas学习之Pandas数据结构详解

    目录 1Pandas介绍 2Pandas数据结构 2.1Series 2.2DataFrame 1 Pandas介绍 2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 以Numpy为基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构 Numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢? 增强图表可读性 便捷的数据处理能力 读取文件方便

  • python数学建模是加深Numpy和Pandas学习

    目录 前言 Numpy 学习 1-numpy.array 2-numpy.empty 3-numpy.zeros 4-numpy.ones NumPy 从已有的数组创建数组 1-numpy.asarray 2-numpy.frombuffer 3-numpy.fromiter NumPy 从数值范围创建数组 1-numpy.arange 2-numpy.linspace 3-numpy.logspace 综合运用[array.arange.linspace.lonspace]: 综合运用[one

  • 用scikit-learn和pandas学习线性回归的方法

    对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了. 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦.:) 这里我们用UCI大学公开的机器学习数据来跑线性回归. 数据的介绍在这:http://archive.ics.uci.edu/ml/datasets/Combined+Cycle+Power+Plant 数据的下载地址在这:http://archive.ics.uci.edu/ml/mach

  • pandas 强制类型转换 df.astype实例

    废话不多说,大家还是直接看代码吧! import pandas as pd from matplotlib import pyplot as plt from datetime import datetime filename='sitka_weather_2014.csv' df=pd.read_csv(filename) print(df.dtypes) df[' Min Humidity']=df[' Min Humidity'].astype('float64') df=df.astyp

随机推荐