解决python中set与dict的无序问题

2026-02-16 21:41:24

每个熟悉python的人都知道，python提供给了我们各种各样原生的数据结构，如list、tuple、set、dict等等。这些形形色色的数据结构为我们程序猿提供了业务支持。但是要用好这些对象，可就要理解这些结构的特点。

比如简单的区分：可变与不可变、有序与无序。

那么本文就想和大家分享一下，这个无序中的细节。

在开始之前，本蟒蛇严重申明，集合和字典是无序的！！集合和字典是无序的！！集合和字典是无序的！！不要看完本蛇说完，然后得到了什么奇奇怪怪的结论！本文基于python3.6进行讲解，什么你还是2.7？兄弟醒醒，都2018年了o(∩_∩)o 哈哈

字典和集合是无序的，只要你懂一点点python的皮毛，你都熟知这句话。大家在初识python时就学习过，什么是可迭代对象（分清楚这个多半是想知道到底啥能被for循环遍历），什么是可变可迭代对象，什么是不可变可迭代对象，什么是无序什么是有序。但大家有想过证明无序嘛？自然会想，本蟒蛇也不例外。那么如何证明无序性呢？简单暴力的解决办法，随便写个两行代码，定义一个set然后print看结果呗！

我的测试代码如下：

s = {'a','b','c'}
print(s)

真的是简单暴力又直接，看到这两行代码不经感叹，人生苦短，我用python（本蟒蛇大学学的java）。好了，当我疯狂运行这个程序的时候输出结果自然也不唯一。

无序嘛！就是这个意思~

但是事情没有那么简单，我无意又用int类型试了一试，如下：

s = {1,2,3}
print(s)

猜猜发生了什么？这种情况下，无论我怎么疯狂输出，疯狂运行这段代码，我得到的结果却是唯一的，那就是print了｛1，2，3｝

通过反复尝试我发现，只要是int类型，那么set好像就变成有序了，无论声明这个set时数字如何摆放，输出结果总是以一种固定的顺序！同样我将dict字典的key值设为int类型，这时候字典也变成了固定的排序方式。

这是为什么呢？

讲到这里，本蛇需要继续声明set和dict是无序的！别怀疑你的专业知识。那么为什么出现这种现象呢，答案只需要从底层源码中就能找到。

简单来说，就是字典和集合的无序性在python是如何实现的？

字典和集合无序的实现方式是hash表。没错，他们是通过hash值来将对象放入hash表中，从而达到无序的操作（众所周知对象的hash值是不断变化的）。

代码如下：

s = {'A','B','C'}
print(hash('A'))
print(hash('B'))
print(hash('C'))
print(s)

通过打印出hash值，结果也就一目了然啦~

就像上图显示一样，每次的hash值都不同，那么字符ABC在hash表中的位置也不同，然而set就是依据hash表来进行排列的，这就实现了集合的无序。

那么同样的操作我们放在int类型上呢？

s = {1,2,3}
print(hash(1))
print(hash(2))
print(hash(3))
print(s)

到这一步，可能有些猿们就知道结果了，没错结果如下：

无论我多努力的输出，123的hash值却那么任性就是123。是的，python中int型的hash值就是它本身，那么set或dict中的排序方式又是通过hash表实现的，所以自然顺序就不会变。

所以，问题解决啦~就是因为hash的原因，导致了这一怪异现象。提到了hash表不得不佩服python的精妙，dict是原生数据结构中常用来储存大量复杂数据的工具，类似数据库。

这种情况下，查询效率真的是很关键的存在。利用了hash表，空间换时间的方式大大提高了查询效率，妙呀~

所以！不知道大家在做列表随机的时候会不会这样操作，反正本蟒蛇是干过（年少不懂事~），就是类似下面的代码：

L = ['a','b','c']
L = list(set(L))
print(L)

有没有？？完美！精简！做随机我甚至都没导入random模块！在没有重复对象的情况下转为集合在转回来不就随机了嘛~那么通过上面的分析，当出现int类型时这个随机就失去了意义啦~避免这样使用哟。而且在真正的生产过程中，你用到列表随机说明就有重复值呀~如果没有。。为什么不直接就用set呢。。。Σ( ° △ °|||)︴可别忘了set还带去重呢！

所以！记住set是无序的！也千万别钻int值是有序的这个空子！因为简单的说，我运行时是CPython作为解释器的，别的结果可能不一样哟~而且python是一门胶水语言，百搭的中央空调，和什么都能配~所以不能保证你的代码绝对只用cPython作为解释器。

所以set与dict是无序的~但是无序的世界里也有小惊喜等着我们发现~

补充：Python中关于dict和set的比较

语法	dict	set
定义	通过键-值储存的字典	只储存list值的集合
性质	键和值一一对应	储存的值不能重复
用法	存入：字典名[‘键'] = 值删除：字典名.pop(‘键') 替换：字典名[‘键'] = 新值	存入集合名.add(内容) 删除：集合名.remove(值) 交并补运算：

共同点：

set的原理和dict一样，所以，同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证set内部“不会有重复元素”。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我们。如有错误或未考虑完全的地方，望不吝赐教。

在Python中使用dict和set方法的教程

dict Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度. 举个例子,假设要根据同学的名字查找对应的成绩,如果用list实现,需要两个list: names = ['Michael', 'Bob', 'Tracy'] scores = [95, 75, 85] 给定一个名字,要查找对应的成绩,就先要在names中找到对应的位置,再从scores取出对应的成绩,list越长,耗时越长. 如
python中dict使用方法详解

dict的特性 dict是python中的一个可变的数据类型,用{}表示,dict的key必须是不可变的数据类型,而value的数据类型可以任意. 格式:{key:value,key:value,key:value} 注: 键值对如果是字符串使用单引号,最后一个键值对没有逗号 dict的优点 ①:查询速度快,可以二分查找 ②:key是不可以重复的注: 不可变数据类型: 元组,bool,int , str 可以hash set 可变数据类型: dict ,list dict的方法 1,增加的方法
Python中字典（dict）合并的四种方法总结

本文主要给大家介绍了关于Python中字典(dict)合并的四种方法,分享出来供大家参考学习,话不多说了,来一起看看详细的介绍: 字典是Python语言中唯一的映射类型. 映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表. 字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型. 字典类型与序列类型的区别: 1. 存取和访问数据的方式不同. 2. 序列类型只用数字类型的键(从序列的开始按数值顺序索引
python中dict()的高级用法实现

collections中defaultdict的用法一.字典的键映射多个值将下面的列表转换成字典一个字典就是一个键对应一个单值得映射,而上面的列表中有相同的键,如果你想要一个键映射多个值,那么就需要将这多个值放到另外的序列中,比如list或者set里面,像下面这样: 你可以很方便的使用 collections 模块中的 defaultdict 来构造这样的字典. defaultdict 的一个特征是它会自动初始化每个 key 刚开始对应的值. 当然这个默认的容器不一定是 list, 也可以
解决python中set与dict的无序问题

每个熟悉python的人都知道,python提供给了我们各种各样原生的数据结构,如list.tuple.set.dict等等.这些形形色色的数据结构为我们程序猿提供了业务支持.但是要用好这些对象,可就要理解这些结构的特点. 比如简单的区分:可变与不可变.有序与无序. 那么本文就想和大家分享一下,这个无序中的细节. 在开始之前,本蟒蛇严重申明,集合和字典是无序的!!集合和字典是无序的!!集合和字典是无序的!!不要看完本蛇说完,然后得到了什么奇奇怪怪的结论!本文基于python3.6进行讲解,什么你
Python中xml和dict格式转换的示例代码

在做接口自动化的时候,请求数据之前都是JSON格式的,Python有自带的包来解决.最近在做APP的接口,遇到XML格式的请求数据,费了很大劲来解决,解决方式是:接口文档拿到的是XML,在线转化为json格式(目的是拿到xml数据的模板),存放到json文件中,根据接口名去提取. github原文介绍:使用XML的Python模块感觉就像您在使用JSON 链接:https://github.com/martinblech/xmltodict 下载xmltodict(pip install xml
Python中defaultdict与dict的差异详情

目录一.问题描述二.解决方案三.结语本文转自微信公众号:"算法与编程之美", 一.问题描述在collections模块中的defauldict使用时与dict有何不同,为何我们用dict中的key值不存在时会报错,而defaudict不会报错,下面做出解答. 二.解决方案以解决遇到的问题用来解答. 代码示例: import collections //引用collections模块 dic=collections.defaultdict(int) //利用模块中的defau
解决Python中字符串和数字拼接报错的方法

前言众所周知Python不像JS或者PHP这种弱类型语言里在字符串连接时会自动转换类型,如果直接将字符串和数字拼接会直接报错. 如以下的代码: # coding=utf8 str = '你的分数是:' num = 82 text = str+num+'分 | 琼台博客' print text 执行结果直接报错:TypeError: cannot concatenate 'str' and 'int' objects 解决这个方法只有提前把num转换为字符串类型,可以使用bytes函数把int
完美解决python中ndarray 默认用科学计数法显示的问题

机器环境: Python 3.6.4 numpy==1.14.0 pandas==0.22.0 解决方法: np.set_printoptions(suppress=True) 默认情况下,ndarray数组采用科学计数法显示: 加入代码后: 以上这篇完美解决python中ndarray 默认用科学计数法显示的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
解决Python中定时任务线程无法自动退出的问题

python的线程有一个类叫Timer可以,用来创建定时任务,但是它的问题是只能运行一次,如果要重复执行,则只能在任务中再调用一次timer,但这样就存在新的问题了,就是在主进程退出后,不能正常退出子线程. from threading import Timer def scheduletaskwrap(): pritn "in task" Timer(10, scheduletaskwrap).start() Timer(10, scheduletaskwrap).start() 象
解决python中使用PYQT时中文乱码问题

如题,解决Python中用PyQt时中文乱码问题的解决方法: 在中文字符串前面加上u,如u'你好,世界',其他网上的方法没有多去探究,Python的版本也会影响解决方法,故这里只推荐这种. (有人说用toLocal8bit函数也可以,我试了下,貌似不行)请看例子: #coding=utf-8 from PyQt4 import QtGui, QtCore s = QtCore.QString(u'你好(hello)世界(world)') t = s.toLocal8Bit() u = unico
解决python中导入win32com.client出错的问题

准备写一个操作Excel脚本却在导入包的时候出现了一个小问题导入包 from Tkinter import Tk from time import sleep, ctime from tkMessageBox import showwarning from urllib import urlopen import win32com.client as win32 报错提示 Traceback (most recent call last): File "estock.pyw", li
解决Python中pandas读取*.csv文件出现编码问题

1.问题在使用Python中pandas读取csv文件时,由于文件编码格式出现以下问题: Traceback (most recent call last): File "pandas\_libs\parsers.pyx", line 1134, in pandas._libs.parsers.TextReader._convert_tokens File "pandas\_libs\parsers.pyx", line 1240, in pandas._libs

解决python中set与dict的无序问题

那么本文就想和大家分享一下，这个无序中的细节。

共同点：

相关推荐

随机推荐