Python常用编码的区别介绍

2026-05-08 11:43:25

Python2内容默认ascii进行编码,而Python3对内容进行编码的默认为utf-8。这个编码问题，也不是Python的问题，所有语言都有乱码的问题，所以今天主要跟大家聊聊这4个常见的编码。

主要有以下几个编码:

1、ASCII

ASCII码使用一个字节编码，所以它的范围基本是只有英文字母、数字和一些特殊符号，只有256个字符。

2、Unicode

俗称万国码,把所有的语言统一到一个编码里.解决了ascii码的限制以及乱码的问题。

unicode码一般是用两个字节表示一个字符,特别生僻的用四个字节表示一个字符。

3、UTF-8

新的问题出现了,如果统一成unicode编码,乱码问题从此消失了。但是如果你写的文本基本上都是英文的,用Unicode编码比ascii编码需要多一倍的存储空间,在存储和传输上十分不方便。

utf-8应用而生,它是一个"可变长的编码方式",如果是英文字符,则采用ascii编码,占用一个字节.如果是常用汉字,就占用三个字节,如果是生僻的字就占用4~6个字节.

4、GBK

GBK是只用来编码汉字的，GBK全称《汉字内码扩展规范》，使用双字节编码。

介绍完上面四种，下面贴上一张5种常见编码的对比，更直观的了解这几种编码的区别。

到此这篇关于Python常用编码区别的文章就介绍到这了。希望对大家的学习有所帮助，也希望大家多多支持我们。

Python字符集和字符编码详情

目录前言字符集和字符编码小结前言这一次我们分析一下Python的字符串,首先字符串是一个变长对象,因为不同长度的字符串所占的内存是不一样的:但同时字符串又是一个不可变对象,因为一旦创建就不可以再修改了. 而Python中的字符串是通过unicode来表示的,在底层对应的结构体是PyUnicodeObject.不过话说回来,为什么需要unicode呢? 首先计算机存储的基本单位是字节,由8个比特位组成,由于英文字母算上大小写只有52个,再加上若干字符,数量不会超过256个,因此一个字节完
提升Python编码能力的3个重要概念

目录 1. 引言 2. 上下文管理器 3. 类型提示 4. 浅拷贝和深拷贝 5. 总结 1. 引言 Python 是由Guido Van Rossum 于 1991 年创建的一种编程语言.在过去的几年里,越来越多的公司开始使用 Python 进行项目开发,主要是因为它语法简单,有很多方便使用的第三方库.本文主要对Python中一些概念进行抽象总结,理解并使用它们可以极大地提升大家的编码能力. 2. 上下文管理器上下文管理器允许我们以最佳方式分配和释放上下文的资源.对于某些资源的管理上,如果处理
python小例子-缩进式编码+算术运算符+定义与赋值

目录一.缩进式编码二.算术运算符三.定义与赋值以Python 3.x版本为主一.缩进式编码解释型:没有编译环节,直接运行执行代码显示效果缩进式编码风格: 代码块不使用大括号{}包含类.函数逻辑判断代码逻辑判断: a='你好' b='51CTO' f=True if f: c=a+','+b print (c) else: c=a+b print (c) 效果如下: 二.算术运算符特点:易于学习.阅读.维护.跨平台.可扩展等运算符编号算术运算符符号 1
python编码问题汇总

目录一.了解字符编码的知识储备 1. 文本编辑器存取文件的原理(nodepad++,pycharm,word) 2. python解释器执行py文件的原理二.字符编码简介三.字符编码的发展史四.字符编码的使用五.Python2与python3编码区别 1.在python2中有两种字符串类型str和unicode 2. 在python3中也有两种字符串类型str和bytes 一.了解字符编码的知识储备 1. 文本编辑器存取文件的原理(nodepad++,pycharm,word) 打开
Python2和3字符编码的区别知识点整理

python解释器运行代码的流程启动python解释器(相当于文本编辑器)打开文件,显示这个字符并检查语法(涉及字符编码, a=1只是一个很普通的字符)解释字符 (涉及字符编码,再去内存空间生成一个a=1的变量) python2用的是ascii, python3默认是utf8读取字符 # coding:gbk会告诉python3解释器用gbk编码读取字符 python3(了解) 你看到的其实是unicode 但是终端帮你把这个unicode的0和1做一个转换,从unicode转换成了终端能够识
Python 编码处理-str与Unicode的区别

一篇关于STR和UNICODE的好文章整理下python编码相关的内容注意: 以下讨论为Python2.x版本, Py3k的待尝试开始用python处理中文时,读取文件或消息,http参数等等一运行,发现乱码(字符串处理,读写文件,print) 然后,大多数人的做法是,调用encode/decode进行调试,并没有明确思考为何出现乱码所以调试时最常出现的错误错误1 Traceback (most recent call last): File "<stdin>"
python 中文编码乱码问题的解决

目录前言: 一.什么是字符编码. 1.ASCII 2.GB2312 3.Unicode 4.UTF-8 二.Python2中的字符编码三.decode()与encode()方法四.一个字符编码的例子前言: 中文编码问题一直是程序员头疼的问题,而Python2中的字符编码足矣令新手抓狂.本文将尽量用通俗的语言带大家彻底的了解字符编码以及Python2和3中的各种编码问题. 一.什么是字符编码. 要彻底解决字符编码的问题就不能不去了解到底什么是字符编码.计算机从本质上来说只认识二进制中的0和
Python常用编码的区别介绍

Python2内容默认ascii进行编码,而Python3对内容进行编码的默认为utf-8.这个编码问题,也不是Python的问题,所有语言都有乱码的问题,所以今天主要跟大家聊聊这4个常见的编码 . 主要有以下几个编码: 1.ASCII ASCII码使用一个字节编码,所以它的范围基本是只有英文字母.数字和一些特殊符号 ,只有256个字符. 2.Unicode 俗称万国码,把所有的语言统一到一个编码里.解决了ascii码的限制以及乱码的问题. unicode码一般是用两个字节表示一个字符,特别生僻
Linux下find和grep常用命令及区别介绍

在使用linux时,经常需要进行文件查找.其中查找的命令主要有find和grep.两个命令是有区别的. 区别: (1)find命令是根据文件的属性进行查找,如文件名,文件大小,所有者,所属组,是否为空,访问时间,修改时间等. (2)grep是根据文件的内容进行查找,会对文件的每一行按照给定的模式(patter)进行匹配查找. 一.find命令基本格式:find path expression 1.按照文件名查找 (1)find / -name httpd.conf #在根目录下查找文件htt
python自然语言编码转换模块codecs介绍

python对多国语言的处理是支持的很好的,它可以处理现在任意编码的字符,这里深入的研究一下python对多种不同语言的处理. 有一点需要清楚的是,当python要做编码转换的时候,会借助于内部的编码,转换过程是这样的: 复制代码代码如下: 原有编码 -> 内部编码 -> 目的编码 python的内部是使用unicode来处理的,但是unicode的使用需要考虑的是它的编码格式有两种,一是UCS-2,它一共有65536个码位,另一种是UCS-4,它有2147483648g个码位.对于这两种格
Python 常用 PEP8 编码规范详解

Python 常用 PEP8 编码规范代码布局缩进每级缩进用4个空格. 括号中使用垂直隐式缩进或使用悬挂缩进. EXAMPLE: # (垂直隐式缩进)对准左括号 foo = long_function_name(var_one, var_two, var_three, var_four) # (悬挂缩进) 一般情况只需多一层缩进 foo = long_function_name( var_one, var_two, var_three, var_four) # (悬挂缩进) 但下面情况,
Python常用Web框架Django、Flask与Tornado介绍

web框架是什么? web开发框架是一组工具,同时也提供了非常多的资源,供软件开发人员构建和管理网站.提供web服务.编写web应用程序.它是一个抽象工具,能使开发应用程序和重复使用代码的过程变得更容易. 为什么需要web开发框架? 进行自定义软件开发时,web开发框架让整个过程变得更容易,因而开发速度更快.更高效.许多开发框架都很便宜,这也使得整个客户机的成本更小. 一个被广泛使用的框架安全性更高.这主要依赖于该框架背后的社区,在这里,用户成为长期的测试人员,并可以提供修复. 如果发现了安全漏
Python import与from import使用及区别介绍

下面介绍下Python import与from import使用,具体内容如下所示: Python程序可以调用一组基本的函数(即内建函数),比如print().input()和len()等函数.Python本身也内置一组模块(即标准库).每个模块都是一个Python程序,且包含了一组相关的函数,可以嵌入到你的程序之中,比如,math模块包含了数学运算相关的函数,random模块包含随机数相关的函数,等等. 一.import语句在开始使用一个模块中的函数之前,必须用import语句导入该模块.
python 列表,数组和矩阵sum的用法及区别介绍

1. 列表使用sum, 如下代码,对1维列表和二维列表,numpy.sum(a)都能将列表a中的所有元素求和并返回,a.sum()用法是非法的. 但是对于1维列表,sum(a)和numpy.sum(a)效果相同,对于二维列表,sum(a)会报错,用法非法. 2. 在数组和矩阵中使用sum: 对数组b和矩阵c,代码b.sum(),np.sum(b),c.sum(),np.sum(c)都能将b.c中的所有元素求和并返回单个数值. 但是对于二维数组b,代码b.sum(axis=0)指定对数组b对每列求
深入理解Python中的 __new__ 和 __init__及区别介绍

本文的目的是讨论Python中 __new__ 和 __ini___ 的用法. __new__ 和 __init__ 的区别主要表现在:1. 它自身的区别:2. 及在Python中新式类和老式类的定义. 理解 __new__ 和 __init__ 的区别这两个方法的主要区别在于:__new__ 负责对象的创建而 __init__ 负责对象的初始化.在对象的实例化过程中,这两个方法会有些细微的差别,表现于:如何工作,何时定义. Python中两种类的定义方式 Python 2.x 中类的定义分为
Python函数any()和all()的用法及区别介绍

引子平常的文本处理工作中,我经常会遇到这么一种情况:用python判断一个string是否包含一个list里的元素. 这时候使用python的内置函数any()会非常的简洁: fruits = ['apple', 'orange', 'peach'] str = "I want some apples" if any(element in str for element in fruits): print "string contains some fruits."
python requests包的request()函数中的参数-params和data的区别介绍

如下所示: import requests url='http://www.baidu.com' #下面使用requests.request(method, url, **kwargs) re=requests.request('GET',url) 经验证,可用. 我们试着传入一个字典,首先用params参数. 结果为: 亮点在url和args. 我们还用get方法,把dic这个字典传给data试试看. 亮点还是在args和url.惊喜地发现,dic这个字典没传进去. 这是因为: params是

Python常用编码的区别介绍

相关推荐

随机推荐