jupyter读取错误格式文件的解决方案

使用pandas读取xml文件报错

“ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve' ”

解决办法:

转换文件格式,使用excel打开xml文件 选择:文件—>另存为---->弹框

保存以后,再次用pandas读取对应格式的文件读取即可

补充:

在jupyter中读取CSV文件时出现‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte解决方法

导入 import pandas as pd

使用pd.read_csv()读csv文件时,出现如下错误:

UnicodeDecodeError: ‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte

出现原因:

CSV文件不是UTF-8进行编码,而是用gbk进行编码的。jupyter-notebook使用的Python解释器的系统编码默认使用UTF-8.

解决方式有两种

第一种:

1.找到使用的csv文件--->鼠标右键--->打开方式---->选择记事本

2.打开文件选择“文件”----->"另存为“,我们可以看到默认编码是:ANSI,选择UTF-8重新保存一份,再使用pd.read_csv()打开就不会保存了

第二种:

使用pd.read()读取CSV文件时,进行编码

pd.read(filename,encoding='gbk')

比如:

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。

(0)

相关推荐

  • 解决jupyter (python3) 读取文件遇到的问题

    1.出现错误 train_df = pd.read_csv( 'C:\Users\lenovo\Desktop\train.csv',encoding='utf-8') 报错: File "<ipython-input-45-27822e1fee69>" , line 1 train_df = pd.read_csv('C:\Users\lenovo\Desktop\train.csv',encoding='utf-8') ^ SyntaxError : (unicode

  • jupyter notebook读取/导出文件/图片实例

    我就废话不多说,看代码! import numpy as np import matplotlib.pyplot as plt import pandas as pd from pandas import Series,DataFrame # 如果不添加该行,则每次显示图片都需要加上plt.show %matplotlib inline 读入文件:pd.read_csv('./test.csv') 读入图片:plt.imread('./d.jpg') 导出文件 保存图片 plt.savefig(

  • jupyter读取错误格式文件的解决方案

    使用pandas读取xml文件报错 " Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve' " 解决办法: 转换文件格式,使用excel打开xml文件 选择:文件->另存为---->弹框 保存以后,再次用pandas读取对应格式的文件读取即可 补充: 在jupyter中读取CSV文件时出现'utf-8' codec can't decode byte 0xd5 in p

  • PHP读取XML格式文件的方法总结

    本文实例总结了PHP读取XML格式文件的方法.分享给大家供大家参考,具体如下: books.xml文件: <books> <book> <author>Jack Herrington</author> <title>PHP Hacks</title> <publisher>O'Reilly</publisher> </book> <book> <author>Jack Her

  • C#读取csv格式文件的方法

    本文实例讲述了C#读取csv格式文件的方法.分享给大家供大家参考.具体实现方法如下: 一.CSV文件规则   1 开头是不留空,以行为单位. 2 可含或不含列名,含列名则居文件第一行. 3 一行数据不跨行,无空行. 4 以半角逗号(即,)作分隔符,列为空也要表达其存在. 5 列内容如存在半角逗号(即,)则用半角引号(即',')将该字段值包含起来. 6 列内容如存在半角引号(即")则应替换成半角双引号("")转义,并用半角引号(即"")将该字段值包含起来.

  • pandas 读取各种格式文件的方法

    pandas 读取各种格式文件: 前置工序: import pandas as pd csv 文件读取中文错误处理: utf-8 codec can't decode .... pd.read_csv('c:/mydata/jit.csv',encoding='gb18030') sql 读取: import pymysql conn=pymysql.connect(host='127.0.0.1', user='root', passwd='root', db=' employee') sql

  • php简单读取.vcf格式文件的方法示例

    本文实例讲述了php简单读取.vcf格式文件的方法.分享给大家供大家参考,具体如下: /** * 读取.vcf格式文件 * @param $filename */ function readCvf($filename){ $file = fopen($filename,"r"); while(! feof($file)) { $line=fgets($file); $encoding = mb_detect_encoding($line, array('GB2312','GBK','U

  • Python使用xlrd读取Excel格式文件的方法

    本文实例讲述了Python使用xlrd读取Excel格式文件的方法.分享给大家供大家参考.具体如下: 使用xlrd能够很方便的读取excel文件内容,而且这是个跨平台的库,能够在windows,linux/unix,等平台上面使用,代码如下: import xlrd fname = "sample.xls" bk = xlrd.open_workbook(fname) shxrange = range(bk.nsheets) try: sh = bk.sheet_by_name(&qu

  • JAVA使用geotools读取shape格式文件的方法

    先看下JAVA用geotools读取shape格式文件 Shapefile属于一种矢量图形格式,它能够保存几何图形的位置及相关属性.但这种格式没法存储地理数据的拓扑信息. 其中,要组成一个Shapefile,有三个文件是必不可少的,它们分别是".shp", ".shx"与 ".dbf"文件 .shp- 图形格式,用于保存元素的几何实体. .shx- 图形索引格式.几何体位置索引,记录每一个几何体在shp文件之中的位置,能够加快向前或向后搜索一个几

  • win2003服务器/虚拟主机不支持Flv和ANI格式文件的解决方案

    原因是由于windows server 2003上并没有.FLV的这种mime-type类型,对于这一点Adobe给出了它的解决方案.如下: 针对服务器用户: 1. 在2003服务器上,找开IIS管理器. 2. 展开本地服务器名称,右击选择属性,在Internet信息服务标签上,点击最下方的计算机MIME映射下面的编辑按钮. 3. 点击"新类型"按钮,扩展名添上".FLV",内容类型(MIME)添上"flv-application/octet-stream

  • python如何读取和存储dict()与.json格式文件

    目录 读取和存储dict()与.json格式文件 读取.json格式文件并将数据保存到字典中 保存字典数据到.json文件中 在命令行中输出字典时的乱码问题 将字符串数据转化为字典数据 将dict数据写入json文件中 读取和存储dict()与.json格式文件 读取.json格式文件并将数据保存到字典中 数据文件:hg.json {"商家名称": "珍滋味港式粥火锅(工体店)", "评分": 27.0, "地址": &quo

  • ASP.NET(C#)读取Excel的文件内容

    .xls格式       Office2003及以下版本 .xlsx格式 Office2007 及以上版本 .csv格式       以逗号分隔的字符串文本(可以将上述两种文件类型另存为此格式) 读取前两种格式和读取后一种格式会用两种不同的方法. 下面看程序:页面前台: 复制代码 代码如下: <div>       <%-- 文件上传控件  用于将要读取的文件上传 并通过此控件获取文件的信息--%>      <asp:FileUpload ID="fileSele

随机推荐