python数据分析之文件读取详解

目录
  • 前言:
  • 一·Numpy库中操作文件
  • 二·Pandas库中操作文件
  • 三·补充
  • 总结

前言:

如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库

一·Numpy库中操作文件

1.操作csv文件

import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")

a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名

或者

import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)

skiprows:跳过第一行,dtype:数据读出的类型为字符型

2.在pycharm中操作csv文件

import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
     print(x)

reader:迭代器

3.其他情况(.npy类型文件)

import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")

二·Pandas库中操作文件

1.操作csv文件

import pandas as pd
df=pd.read_csv("exl.csv")

或者

import pandas as pd
pd.read_table("exl.csv",sep=',')

sep:分隔符

2.从剪贴板上复制数据

import pandas as pd
BS=pd.read_clipboard

3.读取excel或xlsx文件

import pandas as pd
df=read_excel("exl.xlsx")

三·补充

1.常用

import osos.chdir()

chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.

2.pandas中读取文件的函数

read_csv  从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为逗号

read_table   同上,但默认分隔符为制表符(“t”)

read_fwf  读取定宽列格式数据(无分隔符)

read_clipboard  读取剪贴板中的数据

read_excel  从Excel 或xlsx文件中读取表格数据

read_hdf   读取pandas写的HDF5文件

read_html  读取html文档中的所以表格

read_json    读取json字符串中的数据

read_msgpack 二进制格式编码的pandas数据

read_pickle  读取python pickle 格式中存储的任意对象

read_sas   读取存储于SAS系统自定义存储格式为SAS数据集

read_sql   读取SQL查询结果为pandas的DataFrame

read_stata 读取stata文件格式的数据集

总结

到此这篇关于python数据分析之文件读取详解的文章就介绍到这了,更多相关python文件读取内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python如何实现逐行读取文本文件

    目录 Python 中的 open() 函数是什么 文件名和正确路径 open() 中的可选模式参数 Python 中 open() 函数的其他参数 Python 中的 read() 方法 Python 中的 close() 方法 Python 中的 readline() 方法 Python 中的 readlines() 方法 总结 在Python 中有几种方法可以读取文本文件. 在本文中,我将介绍 open() 函数.read() 方法.readline() 方法.readlines() 方法

  • python读取文件名及后缀详解

    目录 os.listdir() 实验代码: 输出: 结果分析: os.path.splitext() 实验代码: 输出: 结果分析: os.path.split() 实验代码: 输出: 结果分析: 案例分析 思路: 代码实验: 输出: 总结 因为某些原因,需要读取d.lib后缀的文件,在此写下记录 os.listdir() 语法:os.listdir(path) 函数用途:输出路径下所有文件的文件名 实验代码: 假如我们需要读取该文件夹所包含全部文件名 import os path = "E:/

  • Python从csv文件中读取数据及提取数据的方法

    目录 1.从csv文件中读取数据 2.数据切割 数据保存在csv文件中 1.从csv文件中读取数据 参数header=None的有无 (1)没有header=None--直接将csv表中的第一行当作表头 # 读取数据 import pandas as pd data = pd.read_csv("data1.csv") print(data) 打印结果为: (2)有header=None--自动添加第一行当作表头 # 读取数据 import pandas as pd data = pd

  • Python读取和存储yaml文件的方法

    YAML 是 "YAML Ain't a Markup Language"(YAML 不是一种标记语言)的递归缩写.在开发的这种语言时,YAML 的意思其实是:"Yet Another Markup Language"(仍是一种标记语言). YAML 的语法和其他高级语言类似,并且可以简单表达清单.散列表,标量等数据形态.它使用空白符号缩进和大量依赖外观的特色,特别适合用来表达或编辑数据结构.各种配置文件.倾印调试内容.文件大纲(例如:许多电子邮件标题格式和YAML

  • python数据分析之文件读取详解

    目录 前言: 一·Numpy库中操作文件 二·Pandas库中操作文件 三·补充 总结 前言: 如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库:如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库 一·Numpy库中操作文件 1.操作csv文件 import numpy as np a=np.random.randint(0,10,size=(3,4)) np.savetext("score.csv",a,deliminte

  • python处理xml文件操作详解

    目录 1.python 操作xml的方式介绍 2.ElementTree模块 3.解析xml格式字符串并获取根节点 4.读取节点内容,getroot() 5.通标标签名直接获取标签(find,findall) 6.全文搜索标签名(类似xpath路径查找标签) 7.修改节点 8.删除节点 9.构建文件 方式1 (Element) 方式2 (makeelement) 方式3 1.python 操作xml的方式介绍 查看全部包含“三种⽅法: ⼀是xml.dom. * 模块,它是W3CDOMAPI的实现

  • Python 修改CSV文件实例详解

    目录 前言 Python 修改CSV文件 前言 由于 CSV 文件仅仅是简单的文本文件,因此更新 CSV 文件中内容的最佳方式是首先读取文件中的数据,并将它们处理为 Python 内部对象,进行更改,然后以相同的格式覆盖原始数据. Python 修改CSV文件 在本节中,我们将学习如何使用 Python 修改 CSV 文件中的数据. 假设在CSV文件中有以下数据,其中用户 '1' 对电影 'Star Wars' 的评分有误,其实际评分为 7.9,因此需要修改此文件. User name Movi

  • python数据分析工具之 matplotlib详解

    不论是数据挖掘还是数学建模,都免不了数据可视化的问题.对于 Python 来说,matplotlib 是最著名的绘图库,它主要用于二维绘图,当然也可以进行简单的三维绘图.它不但提供了一整套和 Matlab 相似但更为丰富的命令,让我们可以非常快捷地用 python 可视化数据. matplotlib基础 # 安装 pip install matplotlib 两种绘图风格: MATLAB风格: 基本函数是 plot,分别取 x,y 的值,然后取到坐标(x,y)后,对不同的连续点进行连线. 面向对

  • Python数据分析之pandas函数详解

    一.apply和applymap 1. 可直接使用NumPy的函数 示例代码: # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs(df)) 运行结果: 0         1         2         3 0 -0.062413  0.844813 -1.853721 -1.980717 1 -0.539628 -1.975173 -0.856597 -2.612406

  • Python数据分析之matplotlib绘图详解

    目录 多子图 散点图 水平柱状图 同位置柱状图 多子图 figure是绘制对象(可以理解为一个空白的画布),一个figure对象可以包含多个Axes子图,一个Axes是一个绘图区域,不加设置时,Axes为1,且每次绘图其实都是在figure上的Axes上绘图. 我们是在图形对象上面的Axes区域进行作画 1.add_axes():添加区域 2.Matplotlib定义一个axes类,该类的对象称为axes对象(即轴域对象),它指定一个有数值范围限制的绘图区域.再给定一个画布中,可以包含多个axe

  • Python数据分析JupyterNotebook3魔法命令详解及示例

    目录 1.魔法命令介绍 %lsmagic:列出所有magics命令 %quickref:输出所有魔法指令的简单版帮助文档 %Magics_Name?:输出某个魔法命令详细帮助文档 2.Line magics:Line魔法指令 3.Cell magics:Cell魔法指令 写bash程序 写perl程序 1.魔法命令介绍 %lsmagic:列出所有magics命令 Available line magics:[对当前行使用共计93个] %alias %alias_magic %autoawait

  • Python数据分析模块pandas用法详解

    本文实例讲述了Python数据分析模块pandas用法.分享给大家供大家参考,具体如下: 一 介绍 pandas(Python Data Analysis Library)是基于numpy的数据分析模块,提供了大量标准数据模型和高效操作大型数据集所需要的工具,可以说pandas是使得Python能够成为高效且强大的数据分析环境的重要因素之一. pandas主要提供了3种数据结构: 1)Series,带标签的一维数组. 2)DataFrame,带标签且大小可变的二维表格结构. 3)Panel,带标

  • Python操作csv文件实例详解

    一.Python读取csv文件 说明:以Python3.x为例 #读取csv文件方法1 import csv csvfile = open('csvWrite.csv',newline='')#打开一个文件 csvReader = csv.reader(csvfile)#返回的可迭代类型 print(type(csvReader)) for content in csvReader: print(content) csvfile.close()#关闭文件 //运行结果如下: <class '_c

  • python解析yaml文件过程详解

    YAML语法规则: http://www.ibm.com/developerworks/cn/xml/x-cn-yamlintro/ 下载PyYAML: http://www.yaml.org/ 解压安装: python setup.py install 1.新建test.yaml文件,内容如下: name: Tom Smith age: 37 spouse: name: Jane Smith age: 25 children: - name: Jimmy Smith age: 15 - nam

随机推荐