详解python的二进制转化模块
在pyton中,通过struct模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。
其中,struct.pack的输入格式为struct.pack(format, v1, v2, ...),其中format为格式字符串,v1,v2..为将要转成bytes的字符。
例如
>>> import struct
>>> struct.pack('i', 15)
b'\x0f\x00\x00\x00'
>>> struct.pack('iii', 15, 16, 17)
b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'
>>> struct.pack('b', 255) #b格式的取值范围是-128到127
struct.error: byte format requires -128 <= number <= 127
>>> struct.pack('B', 200)
b'\xc8'
>>> struct.pack('B', 71) #128以内可用ASCII表示
b'G'
i代表int,15对应的二进制代码为F000,故其输出为b\x0f\x00\x00\x00。当格式字符串为iii时,说明要将三个数字以整数类型转化为二进制。
其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型
| C语言类型 | C语言类型 | 标准大小 | ||
|---|---|---|---|---|
b |
signed char | B |
unsigned char | 1 |
h |
short | H |
unsigned short | 2 |
i |
int | I |
unsigned int | 4 |
l |
long | L |
unsigned long | 4 |
q |
long long | Q |
unsigned long long | 8 |
n |
ssize_t | N |
size_t |
其他类型
| 格式 | C 类型 | Python 类型 | 标准大小 |
|---|---|---|---|
x |
填充字节 | 无 | |
c |
char | 长度为1的字节串 | |
? |
_Bool | bool | 1 |
e |
float | 2 | |
f |
float | float | 4 |
d |
double | float | 8 |
s |
char[] | 字节串 | |
p |
char[] | 字节串 | |
P |
void* | 整数 |
struct中提供了获取标准大小的函数,calcsize:
>>> struct.calcsize('B')
1
>>> struct.calcsize('i')
4
除了声明被格式化时的数据类型,struct还可以指定对齐方式,例如
>>> struct.pack("i",15)
b'\x0f\x00\x00\x00'
>>> struct.pack(">i",15) #小端序
b'\x00\x00\x00\x0f'
>>> struct.pack("<i",15) #大端序
b'\x0f\x00\x00\x00'
其对应字符的含义分别为
@ |
= |
< |
> |
! |
|---|---|---|---|---|
| 本机 | 本机 | 小端 | 大端 | 网络(大端) |
其中默认为@,即本机字节顺序。
在熟悉了pack之后,与之对偶的unpack也就没啥难度了
>>> test = struct.pack("III",125,1255,12555)
>>> struct.unpack("III",test)
(125, 1255, 12555)
除了pack和unpack,struct模块还提供了C语言风格的一对函数pack_into和unpack_from,二者的声明分别为
struct.pack_into(format, buffer, offset, v1, v2, ...) struct.unpack_from(format, /, buffer, offset=0)
其中buffer表示缓冲流,在pack_into中,将v1,v2...以offset的偏置打包入buffer中;在unpack_from中,将buffer中的数据从offset处依次取出。
struct中封装了用于二进制处理的类Struct,按照以往经验,其pack函数的实现方法很有可能是下面这种
def pack(format,*args):
return Struct(format).pack(args)
其中Struct的初始化方法就是输入一个格式化字符串,例如
>>> s = struct.Struct("III")
>>> s.pack(1,2,3)
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注我们的更多内容!
赞 (0)
