老生常谈Python中的Pickle库

2025-04-24 01:20:52

简介

Python 中有个序列化过程叫作 pickle，它能够实现任意对象与文本之间的相互转化，也可以实现任意对象与二进制之间的相互转化。也就是说，pickle 可以实现 Python 对象的存储及恢复。

pickle与json比较

pickle协议和JSON (JavaScript对象表示法)之间有基本的区别:
JSON是一种文本序列化格式(它输出unicode文本，尽管大多数时候它被编码为utf-8)，而pickle是二进制序列化格式;
JSON是人类可读的，而pickle则不是;
JSON在Python生态系统之外是可互操作和广泛使用的，而pickle是特定于Python的;
默认情况下，JSON只能表示Python内置类型的一个子集，并且没有自定义类；pickle可以表示极其大量的Python类型(其中许多是自动的，通过聪明地使用Python的内省设施，复杂的情况可以通过实现特定的对象api来解决)。

pickle模块的应用很简单，只有四个方法

dumps()：将 Python 中的对象序列化成二进制对象，并返回
loads()：读取给定的二进制对象数据，并将其转换为 Python 对象
dump()：将 Python 中的对象序列化成二进制对象，并写入文件
load()：读取指定的序列化数据文件，并返回对象

其中 dumps 和 loads 实现基于内存的 Python 对象与二进制互转；dump 和 load 实现基于文件的 Python 对象与二进制互转

函数

dumps

dumps(obj, protocol=None)

obj：要转换的 Python 对象
protocol：pickle 的转码协议，取值为 0、1、2、3、4，其中 0、1、2 对应 Python 早期的版本，3 和 4 则对应 Python 3.x 版本及之后的版本。未指定情况下，默认为 3

import pickle

dic = {"name": "lihua", "age": 30}
pe = pickle.dumps(dic)  # 将任意数据类型类型转换成二进制文件
print(pe)

loads

loads(data)

data 参数表示要转换的二进制对象

import pickle

dic = {"name": "lihua", "age": 30}
pe = pickle.dumps(dic)  # 将任意数据类型转换成二进制文件
dic1 = pickle.loads(pe)  # 将二进制文件恢复成原来的数据类型
print(dic1)

dump

dump (obj, file,protocol=None)

obj：要转换的 Python 对象
file：转换到指定的二进制文件中，要求该文件必须是以"wb"的打开方式进行操作
protocol：pickle 的转码协议，取值为 0、1、2、3、4，其中 0、1、2 对应 Python 早期的版本，3 和 4 则对应 Python 3.x 版本及之后的版本。未指定情况下，默认为 3

import pickle

dic = {"name": "lihua", "age": 30}
with open("pickle.pickle", "wb") as f:
    pickle.dump(dic, f)  # 将转换后的二进制文件存储在pickle.pickle文件里面

load

此函数和 dump() 函数相对应，用于将二进制对象文件转换成 Python 对象

load(file)

file 参数表示要转换的二进制对象文件（必须以 "rb" 的打开方式操作文件）

import pickle

dic = {"name": "lihua", "age": 30}
with open("pickle.pickle", "rb") as f:
    dic1 = pickle.load(f)  # 将存储的文件内容导出为python对象

print(dic1)

到此这篇关于Python中的Pickle库的文章就介绍到这了,更多相关Python Pickle库内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Python使用Pickle库实现读写序列操作示例

本文实例讲述了Python使用Pickle库实现读写序列操作.分享给大家供大家参考,具体如下: 简介 pickle模块实现了用于对Python对象结构进行序列化和反序列化的二进制协议."Pickling"是将Python对象转换为字节流的过程,"unpickling"是反向操作,由此字节流二进制文件或字节对象)转换回对象结构. 模块方法 pickle.dump(obj, file, protocol=None, *, fix_imports=True) 将obj以二
python爬取之json、pickle与shelve库的深入讲解

前言在使用Python进行网络编程或者爬取一些自己感兴趣的东西时,总避免不了进行一些数据传输.存取等问题,Python的文件对象以及其他扩展库,已经解决了很多关于文本和二进制数据存取的问题,比如网页内容.图片&音视频等多媒体内容,但这些数据基本是最终的数据形态存储,有没有办法可以存储Python本身的一些对象数据,后续在使用的时候,再直接加载为Python对象即可,本文便讲解下常用的Python对象数据存取.传输解决方案,即pickle.shelve.json. 内容比较基础,也比较简单,但也
Python 解析库json及jsonpath pickle的实现

1. 数据抽取的概念 2. 数据的分类 3. JSON数据概述及解析 3.1 JSON数据格式 3.2 解析库json json模块是Python内置标准库,主要可以完成两个功能:序列化和反序列化.JSON对象和Python对象映射图如下: 3.2.1 json序列化对象(字典/列表) 通过 json.dump()/json.dumps() ==> json字符串.示例代码如下: import json class Phone(object): def __init__(self, name,
Python pickle类库介绍（对象序列化和反序列化）

一.pickle pickle模块用来实现python对象的序列化和反序列化.通常地pickle将python对象序列化为二进制流或文件. python对象与文件之间的序列化和反序列化: 复制代码代码如下: pickle.dump() pickle.load() 如果要实现python对象和字符串间的序列化和反序列化,则使用: 复制代码代码如下: pickle.dumps() pickle.loads() 可以被序列化的类型有: * None,True 和 False; * 整数,浮点数
Python标准库json模块和pickle模块使用详解

将Python数据类型转换为其他代码格式叫做(序列化),而json就是在各个代码实现转换的中间件. 序列化要求: 1. 只能有int,str,bool,list,dict,tuple的类型支持序列化. 2. json序列化是以字符串形式出现.那么:lis= "[11,22,33]" 这样的也能称为序列化. 3. 必须将数据类型包裹在list或dict内进行转换. 4. json内部的str格式,必须以双引号来进行包裹. 5. bool值转换为小写的首字母 json.dumps 将py转
Python 中Pickle库的使用详解

在"通过简单示例来理解什么是机器学习"这篇文章里提到了pickle库的使用,本文来做进一步的阐述. 那么为什么需要序列化和反序列化这一操作呢? 1.便于存储.序列化过程将文本信息转变为二进制数据流.这样就信息就容易存储在硬盘之中,当需要读取文件的时候,从硬盘中读取数据,然后再将其反序列化便可以得到原始的数据.在Python程序运行中得到了一些字符串.列表.字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据.python模块大全中的Pickle模块就派
老生常谈Python中的Pickle库

目录简介 pickle与json比较函数 dumps loads dump load 简介 Python 中有个序列化过程叫作 pickle,它能够实现任意对象与文本之间的相互转化,也可以实现任意对象与二进制之间的相互转化.也就是说,pickle 可以实现 Python 对象的存储及恢复. pickle与json比较 pickle协议和JSON (JavaScript对象表示法)之间有基本的区别: JSON是一种文本序列化格式(它输出unicode文本,尽管大多数时候它被编码
利用Python中的pandas库对cdn日志进行分析详解

前言最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量.状态码统计,TOP IP.URL.UA.Referer等.以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G.行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长.于是研究了下Python pandas这个数据处理库的使用.一千万行日志,处理完成在40s左右. 代码 #!/usr/bin/python # -*- coding: utf-8 -*- # sudo pip instal
对python中的xlsxwriter库简单分析

一.xlsxwriter 基本用法,创建 xlsx 文件并添加数据官方文档:http://xlsxwriter.readthedocs.org/ xlsxwriter 可以操作 xls 格式文件注意:xlsxwriter 只能创建新文件,不可以修改原有文件.如果创建新文件时与原有文件同名,则会覆盖原有文件 Linux 下安装: sudo pip install XlsxWriter Windows 下安装: pip install XlsxWriter # coding=utf-8 from
在Python中利用pickle保存变量的实例

在工作中出于某些原因,我们可能需要将变量保存下来,这样下次就可以直接去赋值而不用重新执行某些重复耗时的操作了,这里我们用到了Python的pickle包来做变量的存储和变量加载,大家注意这个包是python自带的,不需要另外再去安装. pickle用法如下: pickle.dump(obj, file, protocol=None,*,fix_imports=True) pickle.load(file, *,fix_imports=True, encoding="ASCII". er
Python中logging日志库实例详解

logging的简单使用用作记录日志,默认分为六种日志级别(括号为级别对应的数值) NOTSET(0) DEBUG(10) INFO(20) WARNING(30) ERROR(40) CRITICAL(50) special 在自定义日志级别时注意不要和默认的日志级别数值相同 logging 执行时输出大于等于设置的日志级别的日志信息,如设置日志级别是 INFO,则 INFO.WARNING.ERROR.CRITICAL 级别的日志都会输出. |2logging常见对象 Logger:日志,
Python中的wordcloud库安装问题及解决方法

今天下载wordcloud的时候出现了很多问题,在此总结总结 1.问题一:You are using pip version 19.0.3, however version 20.0.2 is available-问题解决方法: 打开cmd输入如下命令 python -m pip install -U pip 2.问题二:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual 解决方法: 方法1(不
使用豆瓣源来安装python中的第三方库方法

这里以安装简单的nonebot库为例子欧克,简明扼要,拿走点赞哟: 大家想要的豆瓣源如下: 因为有几个,但在这里还是建议使用国内的豆瓣源,本人感觉好用. pip3 install nonebot -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com 解释一下啊:nonebot 这个是你自己要安装的第三方库的名字,自己想要装的第三方库就这改就行了. 下面这些是对于不会安装第三方库的同学们而写,如果会的话可以忽略下面,那就
python中altair可视化库实例用法

作为六大python可视化库,基本上学会都是可以通吃任何领域的存在,本章要给大家介绍的Altair就是其中之一的可视化库,能够将数据转化为非常直观的图片,让我们更加清晰的认知数据之前直观的联系,俨然已经成为可视化库中的新星,好啦,下面就让我们详细了解下这个荣获众多粉丝的可视化库的使用技巧吧. 安装Altair: 依赖JupyterLab $ pip install -U altair vega_datasets jupyterlab 导入Altair: import altair as alt
Python中使用subprocess库创建附加进程

前言 subprocess库提供了一个API创建子进程并与之通信.这对于运行生产或消费文本的程序尤其有好处,因为这个API支持通过新进行的标准输入和输出通道来回传数据. 本篇,将详细介绍Python创建附加进行的库:subprocess. run(运行外部命令) subprocess库本身可以替换os.system(),os.spawnv()等函数.现在我们来通过subprocess库运行一个外部命令,但不采用os.system().示例如下: import subprocess complet
Python中的tkinter库简单案例详解

目录案例一 Label & Button 标签和按钮案例二 Entry & Text 输入和文本框案例三 Listbox 部件案例四 Radiobutton 选择按钮案例五 Scale 尺度案例六 Checkbutton 勾选项案例七 Canvas 画布案例八 Menubar 菜单案例九 Frame 框架案例十 messagebox 弹窗案例十一 pack grid place 放置登录窗口 TKinterPython 的 GUI 库非常多,之所以选择 Tkinte