pandas 转换成行列表进行读取与Nan处理的方法
pandas中有时需要按行依次对.csv文件读取内容,那么如何进行呢?
我们来完整操作一遍,假设我们已经有了一个.csv文件。
# 1.导入包 import pandas as pd # 2读入数据 readFile = pd.read_csv('输出路径',encoding='gb2312') for record in readFile.values: print(record)
至此就完成了整个过程
如果有Nan怎么处理呢?
我们可以在readFile后面加入以下内容:
readFile = readFile.fillna('del_token') 在for record in readFile.values后面加入一个while循环 record = list(record) while ('del_token' in record): record.remove('del_token') print(record) 整个代码看起来就像这样子了: # 1.导入包 import pandas as pd # 2读入数据 readFile = pd.read_csv('输出路径',encoding='gb2312') # 给Nan赋值 readFile = readFile.fillna('del_token') for record in readFile.values: # 转换列表删除Nan while ('del_token' in record): record.remove('del_token') # 打印 print(record)
以上这篇pandas 转换成行列表进行读取与Nan处理的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
pandas Dataframe行列读取的实例
如下所示: import matplotlib.pyplot as plt import tkinter import numpy as np import pandas as pd from pandas import Series,DataFrame data = {'a':[1,2,3], 'c':[4,5,6], 'b':[7,8,9] } frame = DataFrame(data,index=['one','two','three']) print(frame) print(fra
-
python pandas消除空值和空格以及 Nan数据替换方法
在人工采集数据时,经常有可能把空值和空格混在一起,一般也注意不到在本来为空的单元格里加入了空格.这就给做数据处理的人带来了麻烦,因为空值和空格都是代表的无数据,而pandas中Series的方法notnull()会把有空格的数据也纳入进来,这样就不能完整地得到我们想要的数据了,这里给出一个简单的方法处理该问题. 方法1: 既然我们认为空值和空格都代表无数据,那么可以先得到这两种情况下的布尔数组. 这里,我们的DataFrame类型的数据集为df,其中有一个变量VIN,那么取得空值和空格的布尔数组
-
pandas 转换成行列表进行读取与Nan处理的方法
pandas中有时需要按行依次对.csv文件读取内容,那么如何进行呢? 我们来完整操作一遍,假设我们已经有了一个.csv文件. # 1.导入包 import pandas as pd # 2读入数据 readFile = pd.read_csv('输出路径',encoding='gb2312') for record in readFile.values: print(record) 至此就完成了整个过程 如果有Nan怎么处理呢? 我们可以在readFile后面加入以下内容: readFile
-
在Pandas中处理NaN值的方法
关于NaN值 -在能够使用大型数据集训练学习算法之前,我们通常需要先清理数据, 也就是说,我们需要通过某个方法检测并更正数据中的错误. - 任何给定数据集可能会出现各种糟糕的数据,例如离群值或不正确的值,但是我们几乎始终会遇到的糟糕数据类型是缺少值. - Pandas 会为缺少的值分配 NaN 值. 创建一个具有NaN值得 Data Frame import pandas as pd # We create a list of Python dictionaries # 创建一个字典列表 ite
-
把pandas转换int型为str型的方法
今天在数据分析时遇到了一个小问题,这时才发现自己的基础知识真的不牢固,所以这里记录一下解决方法 问题: 我在处理完数据后得到的是一个列表,其中放入的是很多的元组,这时需要从元组中筛选数据保存为csv文件,但是我的数据都是int型的,所以我简单的使用了一个循环wf.write('{},{}\n'.format(str(item[0][0]),str(item[0][1]))),通过str来转换保存为str类型,但是当我再次打开文件时,发现它居然还是int,保存前都是str,真是奇了怪了. 这时该如
-
Python连接HDFS实现文件上传下载及Pandas转换文本文件到CSV操作
1. 目标 通过hadoop hive或spark等数据计算框架完成数据清洗后的数据在HDFS上 爬虫和机器学习在Python中容易实现 在Linux环境下编写Python没有pyCharm便利 需要建立Python与HDFS的读写通道 2. 实现 安装Python模块pyhdfs 版本:Python3.6, hadoop 2.9 读文件代码如下 from pyhdfs import HdfsClient client=HdfsClient(hosts='ghym:50070')#hdfs地址
-
Pandas替换NaN值的方法实现
目录 问题 方法 替换 NaN 值的步骤 参考 替换Pandas DataFram中的 NaN 值 问题 NaN 代表 Not A Number,是表示数据中缺失值的常用方法之一.它是一个特殊的浮点值,不能转换为 float 以外的任何其他类型.NaN 值是数据分析中的主要问题之一.为了得到理想的结果,对 NaN 进行处理是非常必要的. 方法 用零替换Pandas DataFram中的 NaN 值的方法: fillna(): 用于使用指定的方法填充 NA/NaN 值. replace(): da
-
pandas 读取各种格式文件的方法
pandas 读取各种格式文件: 前置工序: import pandas as pd csv 文件读取中文错误处理: utf-8 codec can't decode .... pd.read_csv('c:/mydata/jit.csv',encoding='gb18030') sql 读取: import pymysql conn=pymysql.connect(host='127.0.0.1', user='root', passwd='root', db=' employee') sql
-
对pandas数据判断是否为NaN值的方法详解
实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分. 具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割. def age_map(x): if x < 26: return 0 elif x >=26 and x <= 35: return 1 elif x > 35 and x <= 45: return 2 elif pd.isnull(x): #判断是否为NaN值,== 和in 都无法判断
-
Python Pandas 转换unix时间戳方式
使用pandas自带的pd.to_datetime把 unix 时间戳转为时间时默认是转换为 GMT标准时间 北京时间比这个时间还要加 8个小时, 使用python 自带的 time.localtime 转换时 默认是会处理好时区的问题,可以直接转换为 北京时间的: pandas需要自己处理时区问题 如果是pandas的字段(df.TIME为格式如上的时间戳)可以使用下面的方式转换: 以上这篇Python Pandas 转换unix时间戳方式就是小编分享给大家的全部内容了,希望能给大家一个参考
-
Pandas读取行列数据最全方法
1.读取方法有按行(单行,多行连续,多行不连续),按列(单列,多列连续,多列不连续):部分不连续行不连续列:按位置(坐标),按字符(索引):按块(list):函数有 df.iloc(), df.loc(), df.iat(), df.at(), df.ix(). 2.转换为DF,赋值columns,index,修改添加数据,取行列索引 data = {'省份': ['北京', '上海', '广州', '深圳'], '年份': ['2017', '2018', '2019', '2020'], '
随机推荐
- 浅谈python中copy和deepcopy中的区别
- MongoDB 快速入门
- 深入理解vue Render函数
- 原生Js实现按的数据源均分时间点幻灯片效果(已封装)
- 新手进阶 透彻认识64位操作系统
- J2EE项目代码编写规范分享
- 详解基于本地存储的kvm虚拟机在线迁移
- JavaScript笔记之数据属性和存储器属性
- js资料prototype 属性
- php利用cookies实现购物车的方法
- C语言中sizeof()与strlen()函数的使用入门及对比
- Shell脚本监控网站页面正常打开情况
- 浅谈Java多进程程序的运行模式
- Powershell小技巧之用变量累积记录错误
- sqlserver对字段出现NULL值的处理
- sqlserver 批量删除存储过程和批量修改存储过程的语句
- C#实现HTTP上传文件的方法
- Android 高版本API方法在低版本系统上的兼容性处理
- 详谈signed 关键字
- PHP排序算法系列之归并排序详解