Python数据序列化之pickle模块

目录
  • 1将Python数据存储为本地文件
    • ①存储过程
    • ②加载过程
  • 2将Python数据存储为程序的一部分
    • ①存储过程
    • ②加载过程

前言:

在英语中 pickle 名词是泡菜,动词是腌渍的意思。可以理解为把东西腌起来保存成文件,要用的时候读出来洗洗再用。

pythonpickle模块实现了基本的数据序列化和反序列化。

序列化对象可以在磁盘上保存对象,并在需要的时候读取出来。任何对象都可以执行序列化操作。

pickle的本质是将Python数据还原为内存中的二进制数据,供用户转移、储存。

pickle模块通常会在2种场景下使用:

  • 将Python的数据保存为磁盘上的二进制文件,需要时读取还原为Python数据,可以是可打印的基本数据(字符串、列表、字典等等),也可以是不可打印的类数据。相比之下,使用Json方式只能保存可打印的基本数据
  • 将已经创建好的类数据字符串化,保存为一个变量。在程序下次运行时直接读取变量还原为类数据,省去类数据的创建过程

1 将Python数据存储为本地文件

设计一个程序,输出产物是Excel工作簿output.xlsx,工作簿中有一个工作表out_sheet 是从 标准文档input.xlsx中的 in_sheet 中复制而来。

工作表in_sheet 的内容很庞大,难以用手动重现,通常我们会选择将 标准文档 input.xlsx 作为程序的引用素材放在工程里。程序运行过程中将工作表 in_sheet复制到工作表out_sheet中。

如果我们要求不能明文存储 工作表 in_sheet文件,只能存储工作表对应的Worksheet()数据 ,将使用到pickle模块

① 存储过程

import pickle
from openpyxl import load_workbook

# 创建类数据
wb = load_workbook('input.xlsx')
ws = wb['in_sheet']

# 将 in_sheet 复制到 out_sheet
# 注意,这里的 usr_copy_sheet() 是自定义方式,openpyxl自带的copy_sheet()不能复制不同workbook中的worksheet
usr_copy_sheet(ws, out_ws)

# 将out_ws转化为二进制数据
obj = pickle.dumps(out_ws)

# 将二进制数据存到本地文件,必须使用二进制写入
with open(file='data.txt', mode='wb') as f:
    f.write(obj)

此时,ws被存储到本地文件 data.txt,打开是二进制乱码

② 加载过程

import pickle
from openpyxl.worksheet.worksheet import Worksheet

# 创建空的类数据准备接收数据,如果类有parent属性,必须和要接收的数据保持一致
out_ws= Worksheet(parent=out_wb)

# 将本地文件数据加载到类数据上,必须使用二进制打开文件
with open(file='data.txt', mode='rb') as f:
    out_ws= pickle.loads(f.read())

便可以省去读取 工作表in_sheet,复制到工作表 out_sheet等等过程

2 将Python数据存储为程序的一部分

如果我们要求 工作表in_sheet文件的数据不但不能明文存储,还不能作为外部文件,必须作为 程序.exe 的一部分,以防丢失。有些小程序一共只有一个 exe文件,外挂一个文件不方便,此时可使用到pickle模块

① 存储过程

import pickle
from openpyxl import load_workbook

# 创建类数据
wb = load_workbook('input.xlsx')
ws = wb['in_sheet']

# 将 in_sheet 复制到 out_sheet
# 注意,这里的 usr_copy_sheet() 是自定义方式,openpyxl自带的copy_sheet()不能复制不同workbook中的worksheet
usr_copy_sheet(ws, out_ws)

# 将out_ws转化为二进制数据
obj = pickle.dumps(out_ws)

# 将二进制数据存为py文件,必须使用文本写入
with open(file='out_sheet.py', mode='w') as f:
    # 将二进制数据转为 b'''xxx''' 字符串写入 py文件
    data = 'data=' + str(obj).replace('b\'', 'b\'\'\'') + '\'\''
    f.write(data)

此时,out_ws 被存储到本地文件out_sheet.py,内容是一串二进制码:

data=b'''\x80\x04......'''

② 加载过程

将生成的out_sheet.py 加载到程序中,直接读取数据

import pickle
from openpyxl.worksheet.worksheet import Worksheet
import out_sheet

# 创建空的类数据准备接收数据,如果类有parent属性,必须和要接收的数据保持一致
out_ws= Worksheet(parent=out_wb)

# 直接读取out_sheet.py文件中的data变量
out_ws= pickle.loads(out_sheet.data)

out_sheet.py最终会被编译为程序的一部分

到此这篇关于Python数据序列化之pickle模块的文章就介绍到这了,更多相关Python中的pickle模块内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python中pickle模块浅析

    本章为大家介绍的模块,在python2的时候,并不受宠,主要的问题是存在安全漏洞,发现问题就要及时解决,因此在现在3版本中,已经得到了妥善的修复.pickle模块是序列化模块,主要应用的是在元组和列表中,当元组和列表很接近,元组相当于加了const定义的列表,但是Python中没有const关键字,带入这些观点,来了解以下内容. 模块安装: 无需手动安装,因为是python中的标准模块. 模块函数: pickle.load() 参数:文件名 作用:将文件内容反序列化输出. 模块使用: impor

  • Python pickle模块实现对象序列化

    这篇文章主要介绍了Python pickle模块实现对象序列化,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 作用 对Python对象进行序列化,便于存储和传输 Python对象序列化成bytes类型 pickle.dumps(obj) 将Python对象转化为bytes类型 pickle.loads(str) 将转化成的bytes类型数据还原成对象 Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 0

  • Python3 pickle模块的使用方法详细介绍

    pickle模块特点 1.只能在python中使用,只支持python的基本数据类型. 2.可以处理复杂的序列化语法.(例如自定义的类的方法,游戏的存档等) 3.序列化的时候,只是序列化了整个序列对象,而不是内存地址. pickle: 用于python特有的类型和python的数据类型间进行转换,pickle提供四个功能:dumps,dump,loads,load pickle可以存储什么类型的数据呢? 所有python支持的原生类型:布尔值,整数,浮点数,复数,字符串,字节,None. 由任何

  • Python pickle模块用法实例分析

    本文实例讲述了Python pickle模块用法.分享给大家供大家参考.具体分析如下: pickle提供了一个简单的持久化功能.可以将对象以文件的形式存放在磁盘上. pickle.dump(obj, file[, protocol]) 序列化对象,并将结果数据流写入到文件对象中.参数protocol是序列化模式,默认值为0,表示以文本的形式序列化.protocol的值还可以是1或2,表示以二进制的形式序列化. pickle.load(file) 反序列化对象.将文件中的数据解析为一个Python

  • Python pickle模块用法实例

    python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象. 基本接口: 复制代码 代码如下: pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去. protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示:1:老式的二进制

  • Python数据序列化之pickle模块

    目录 1将Python数据存储为本地文件 ①存储过程 ②加载过程 2将Python数据存储为程序的一部分 ①存储过程 ②加载过程 前言: 在英语中 pickle 名词是泡菜,动词是腌渍的意思.可以理解为把东西腌起来保存成文件,要用的时候读出来洗洗再用. python的pickle模块实现了基本的数据序列化和反序列化. 序列化对象可以在磁盘上保存对象,并在需要的时候读取出来.任何对象都可以执行序列化操作. pickle的本质是将Python数据还原为内存中的二进制数据,供用户转移.储存. pick

  • python数据持久存储 pickle模块的基本使用方法解析

    python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象. 基本接口: pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去. protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示:1:老式的二进制协议:2:2.3版本引

  • Python使用pickle模块实现序列化功能示例

    本文实例讲述了Python使用pickle模块实现序列化功能.分享给大家供大家参考,具体如下: Python内置的pickle模块能够将Python对象序列成字节流,也可以把字节流反序列成对象. import pickle class Student: def __init__(self, name, age): self.name = name self.age = age def say(self): print("I am", self.name) >>> t

  • 详解Python之数据序列化(json、pickle、shelve)

    一.前言 1. 现实需求 每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Python也是一样.很多时候我们会有这样的需求: 把内存中的各种数据类型的数据通过网络传送给其它机器或客户端: 把内存中的各种数据类型的数据保存到本地磁盘持久化: 2.数据格式 如果要将一个系统内的数据通过网络传输给其它系统或客户端,我们通常都需要先把这些数据转化为字符串或字节串,而且需要规定一种统一的数据格式才能让数据接收端正确解析并理解这些数据的含义.XML 是早期被

  • Python之数据序列化(json、pickle、shelve)详解

    什么是序列化 什么是序列化,把程序中的对象或者变量,从内存中转换为可存储或可传输的过程称为序列化.在 Python 中,这个过程称为 pickling,在其他语言中也被称为 serialization,marshalling,flattening 等.程序中的对象(或者变量)在序列化之后,就可以直接存放到存储设备上,或者直接发送到网络上进行传输. 序列化的逆向过程,即为反序列化(unpickling),就是把序列化的对象(或者变量)重新读到内存中~ Python中序列化的模块 模块名称 描述 提

  • Python序列化pickle模块使用详解

    用于序列化的两个模块 json:用于字符串和Python数据类型间进行转换 pickle: 用于python特有的类型和python的数据类型间进行转换 json提供四个功能:dumps,dump,loads,load pickle提供四个功能:dumps,dump,loads,load pickle可以存储什么类型的数据呢? 所有python支持的原生类型:布尔值,整数,浮点数,复数,字符串,字节,None. 由任何原生类型组成的列表,元组,字典和集合. 函数,类,类的实例 pickle模块中

  • 从零学python系列之浅谈pickle模块封装和拆封数据对象的方法

    封装是一个将Python数据对象转化为字节流的过程,拆封是封装的逆操作,将字节文件或字节对象中的字节流转化为Python数据对象,不要从不收信任的数据源中拆封数据.可以封装和拆封几乎任何Python数据对象,主要包括: None , True,False    整数,浮点数,复数    字符串,字节,ByteArray对象    元组,列表,集合,包含可封装对象的字典    在一个模块的顶层定义的函数    在一个模块的顶层定义的内置函数    那是在一个模块的顶层定义的类    __dict_

  • Python使用Pickle模块进行数据保存和读取的讲解

    pickle 是一个 python 中, 压缩/保存/提取 文件的模块,字典和列表都是能被保存的. 但必须注意的是python2以ASCII形式保存,而在python3中pickle是使用转换二进制的数据压缩方法保存数据 所以,在保存或者读取数据的时候,打开文件应该使用'wb' 'rb'的方式 import pickle a = 'owoof' with open('111.pkl', 'wb') as file: pickle.dump(a, file) 在Pickle模块中还有dumps()

  • python持久性管理pickle模块详细介绍

    持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象.通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识.另外,还会让您更深一步地了解Python 的对象序列化能力. 什么是持久性? 持 久性的基本思想很简单.假定有一个 Python 程序,它可能是一个管理日常待办事项的程序,您希望在多次执行这个程序之间可以保存应用程序对象(待办事项).换句话说,您希望将对象存储在磁盘上,便于 以后检索.这就是持久性.要达到这个目

随机推荐