源码解析python中randint函数的效率缺陷

目录
  • 一、前言
  • 二、对randint()运行效率的测试
  • 三、从源码分析randint()的缺陷
    • random.random()
    • random.randint()
  • 四、更快的生成随机整数的方法
    • random.random()
    • 直接使用 getrandbits()
    • 使用 Numpy.random

一、前言

前几天,在写一个与差分隐私相关的简单程序时,我发现了一些奇怪的东西:相对于其他的随机数生成函数,Python的random.randint()函数感觉很慢。 由于 randint() 是 Python 中最为常用的生成随机整数的API,因此我决定深入挖掘其实现机制以了解其运行效率较低的原因。

本文深入探讨了 random 模块的实现,并讨论了一些更为快速的生成伪随机整数的替代方法。

二、对randint()运行效率的测试

首先,我们可以先观察一下random.randint()的运行效率:

$ python3 -m timeit -s 'import random' 'random.random()'
10000000 loops, best of 3: 0.0523 usec per loop
$ python3 -m timeit -s 'import random' 'random.randint(0, 128)'
1000000 loops, best of 3: 1.09 usec per loop

很明显,在生成一个大小在[0, 128]中的随机整数的成本,大约是在生成大小在[0, 1)之间的随机浮点数的 20 倍。

三、从源码分析randint()的缺陷

接下来,我们将从python的源码,来解析randint()的实现机制。

random.random()

首先从random()开始说。该函数定义在Lib/random.py文件中,函数random.random() 是Random类的random方法的别名,而Random.random()直接从_Random继承了random方法。继续向下追溯就会发现,random方法的真正定义是在Modules/_randommodule.c中实现的,其实现代码如下:

static PyObject *
random_random(RandomObject *self, PyObject *Py_UNUSED(ignored))
{
    uint32_t a=genrand_int32(self)>>5, b=genrand_int32(self)>>6;
    return PyFloat_FromDouble((a*67108864.0+b)*(1.0/9007199254740992.0));
}

其中 getrand_int32() 函数是一个C语言实现的梅森旋转算法,其能够快速生成伪随机数。

总结一下,当我们在Python中调用random.random()时,该函数直接调用了C函数,而该C函数唯一的功能就是:生成随机数,并将genrand_int32()的结果转换为浮点数,除此之外没有做任何额外的步骤。

random.randint()

现在让我们看看randint()的实现代码:

def randint(self, a, b):
    """Return random integer in range [a, b], including both end points.
    """
    return self.randrange(a, b+1)

randint函数会调用randrange()函数,因此我们再观察randrange()的源码。

def randrange(self, start, stop=None, step=1, _int=int):
    """Choose a random item from range(start, stop[, step]).

    This fixes the problem with randint() which includes the
    endpoint; in Python this is usually not what you want.
    """
    # This code is a bit messy to make it fast for the
    # common case while still doing adequate error checking.
    istart = _int(start)
    if istart != start:
        raise ValueError("non-integer arg 1 for randrange()")
    if stop is None:
        if istart > 0:
            return self._randbelow(istart)
        raise ValueError("empty range for randrange()")

    # stop argument supplied.
    istop = _int(stop)
    if istop != stop:
        raise ValueError("non-integer stop for randrange()")
    width = istop - istart
    if step == 1 and width > 0:
        return istart + self._randbelow(width)
    if step == 1:
        raise ValueError("empty range for randrange() (%d,%d, %d)" % (istart, istop, width))

    # Non-unit step argument supplied.
    istep = _int(step)
    if istep != step:
        raise ValueError("non-integer step for randrange()")
    if istep > 0:
        n = (width + istep - 1) // istep
    elif istep < 0:
        n = (width + istep + 1) // istep
    else:
        raise ValueError("zero step for randrange()")
    if n <= 0:
        raise ValueError("empty range for randrange()")
    return istart + istep*self._randbelow(n)

在调用下一层的函数之前,randrange()需要对于函数参数进行大量的检查。不过,如果我们不是用stop参数,那么检查速度就会快一些,经过一堆检查之后,才可以调用_randbelow()方法。

默认情况下,_randbelow() 被映射到 _randbelow_with_getrandbits()

def _randbelow_with_getrandbits(self, n):
    "Return a random int in the range [0,n).  Raises ValueError if n==0."

    getrandbits = self.getrandbits
    k = n.bit_length()  # don't use (n-1) here because n can be 1
    r = getrandbits(k)          # 0 <= r < 2**k
    while r >= n:
        r = getrandbits(k)
    return r

从该函数的源码可以发现:该函数的逻辑是计算出n的位数,而后按照位数生成随机比特,因此当n的大小不为2的次幂时,该函数可能需要多次调用getrandbits()getrandbits()是一个利用C语言定义的函数,该函数最终也会调用 getrand_int32(),但由于该函数相对于 random() 函数需要更多的处理过程,导致其运行速度慢两倍。

总而言之,通过python代码或者C代码都可以调用由C所定义的函数。由于 Python 是字节码解释的,因此,任何在调用C函数之前的,用python语言定义的处理过程,都会导致函数的运行速度比直接调用 C 函数慢很多。

这里有几个实验可以帮助我们检验这个假设。首先,让我们尝试在 randrange 中通过调用没有stop参数的 randrange 来减少中间的参数检查过程,提高程序执行的速度:

$ python3 -m timeit -s 'import random' 'random.randrange(1)'
1000000 loops, best of 3: 0.784 usec per loop

正如预期的那样,由于中间运行过程的减少,此时randrange()运行时间比原始的 randint() 好一些。可以在 PyPy 中重新运行比较运行时间。

$ pypy -m timeit -s 'import random' 'random.random()'
100000000 loops, best of 3: 0.0139 usec per loop
$ pypy -m timeit -s 'import random' 'random.randint(0, 128)'
100000000 loops, best of 3: 0.0168 usec per loop

正如预期的那样,PyPy 中这些调用之间的差异很小。

四、更快的生成随机整数的方法

所以 randint() 结果非常慢。当只需要生成少量随机数的时候,可以忽视该函数带来的性能损失,当需要生成大量的随机数时,就需要寻找一个效率够高的方法。

random.random()

一个技巧就是使用random.random()代替,乘以我们的整数限制从而得到整数,由于random()可以生成均匀的[0,1)分布,因此扩展之后也可以得到整数上的均匀分布:

$ python3 -m timeit -s 'import random' 'int(128 * random.random())'
10000000 loops, best of 3: 0.193 usec per loop

这为我们提供了 [0, 128)范围内的伪随机整数,速度更快。需要注意的是:Python 以双精度表示其浮点数,精度为 53 位。当限制超过 53 位时,我们将使用此方法获得的数字不是完全随机的,多的位将丢失。如果不需要这么大的整数,就可以忽视这个问题。

直接使用 getrandbits()

另一种生成伪随机整数的快速方法是直接使用 getrandbits():

$ python3 -m timeit -s 'import random' 'random.getrandbits(7)'
10000000 loops, best of 3: 0.102 usec per loop

此方法快速,但是生成数据范围有限:它支持的范围为[0,2^n]。如果我们想限制范围,取模的方法无法做到范围的限制——这会扭曲分布;因此,我们必须使用类似于上面示例中的 _randbelow_with_getrandbits()中的循环。但是会减慢速度。

使用 Numpy.random

最后,我们可以完全放弃 random 模块,而使用 Numpy:

$ python3 -m timeit -s 'import numpy.random' 'numpy.random.randint(128)'
1000000 loops, best of 3: 1.21 usec per loop

生成单个数据的速度很慢。那是因为 Numpy 不适合仅用于单个数据:numpy能够将成本摊销在用 C语言 创建or操作的大型数组上。为了证明这一点,下边给出了生成 100 个随机整数所需时间:

$ python3 -m timeit -s 'import numpy.random' 'numpy.random.randint(128, size=100)'
1000000 loops, best of 3: 1.91 usec per loop

仅比生成单个慢 60%! 每个整数 0.019 微秒,这是目前最快的方法——比调用 random.random() 快 3 倍。 这种方法如此之快的原因是Numpy将调用开销分摊到所有生成的整数上,并且在 Numpy 内部运行一个高效的 C 循环来生成它们。总之,如果要生成大量随机整数,建议使用 Numpy; 如果只是一次生成一个,它可能没有特别高效。

到此这篇关于源码解析python中randint函数的效率缺陷的文章就介绍到这了,更多相关 python randint 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python中random.randint和random.randrange的区别详解

    在python中,通过导入random库,就能使用randint 和 randrange 这两个方法来产生随机整数.那这两个方法的区别在于什么地方呢?让我们一起来看看! 区别: randint 产生的随机数区间是包含左右极限的,也就是说左右都是闭区间的[1, n],能取到1和n.而 randrange 产生的随机数区间只包含左极限,也就是左闭右开的[1, n),1能取到,而n取不到.randint 产生的随机数是在指定的某个区间内的一个值,而 randrange 产生的随机数可以设定一个步长,也

  • 源码解析python中randint函数的效率缺陷

    目录 一.前言 二.对randint()运行效率的测试 三.从源码分析randint()的缺陷 random.random() random.randint() 四.更快的生成随机整数的方法 random.random() 直接使用 getrandbits() 使用 Numpy.random 一.前言 前几天,在写一个与差分隐私相关的简单程序时,我发现了一些奇怪的东西:相对于其他的随机数生成函数,Python的random.randint()函数感觉很慢. 由于 randint() 是 Pyth

  • 深入源码解析Python中的对象与类型

    对象 对象, 在C语言是如何实现的? Python中对象分为两类: 定长(int等), 非定长(list/dict等) 所有对象都有一些相同的东西, 源码中定义为PyObject和PyVarObject, 两个定义都有一个共同的头部定义PyObject_HEAD(其实PyVarObject有自己的头部定义PyObject_VAR_HEAD, 但其实际上用的也是PyObject_HEAD). 源码位置: Include/object.h PyObject_HEAD Python 内部, 每个对象拥

  • 从源码解析Python的Flask框架中request对象的用法

    from flask import request Flask 是一个人气非常高的Python Web框架,笔者也拿它写过一些大大小小的项目,Flask 有一个特性我非常的喜欢,就是无论在什么地方,如果你想要获取当前的request对象,只要 简单的: 从当前request获取内容: method: 起始行,元数据 host: 起始行,元数据 path: 起始行,元数据 environ: 其中的 SERVER_PROTOCOL 是起始行,元数据 headers: 头,元数据 data: body

  • 从源码解析Android中View的容器ViewGroup

    这回我们是深入到ViewGroup内部\,了解ViewGroup的工作,同时会阐述更多有关于View的相关知识.以便为以后能灵活的使用自定义空间打更近一步的基础.希望有志同道合的朋友一起来探讨,深入Android内部,深入理解Android. 一.ViewGroup是什么?        一个ViewGroup是一个可以包含子View的容器,是布局文件和View容器的基类.在这个类里定义了ViewGroup.LayoutParams类,这个类是布局参数的子类. 其实ViewGroup也就是Vie

  • Java源码解析HashMap的tableSizeFor函数

    aka,HashMap的容量大小必须为2的指数,即16,32,64,128这样的值.那么,在构造函数中,如果调用者指定了HashMap的初始大小不是2的指数,那么,HashMap的tableSizeFor函数,会计算一个大于或等于给定参数的2的指数的值.先来看一下tableSizeFor函数的源码,如下 /** * Returns a power of two size for the given target capacity. **/ static final int tableSizeFo

  • Java源码解析HashMap的resize函数

    HashMap的resize函数,用于对HashMap初始化或者扩容. 首先看一下该函数的注释,如下图.从注释中可以看到,该函数的作用是初始化或者使table的size翻倍.如果table是null,那么就申请空间进行初始化.否则,因为我们在使用2的指数的扩张,在原来table的每个位置的元素,在新的table中,他们要么待在原来的位置,要么移动2的指数的偏移.从这里可以看出,扩容前table每个位置上如果有多个元素,元素之间组成链表时,在扩容后,该链表中的元素,有一部分会待在原地,剩下的元素会

  • 微前端架构ModuleFederationPlugin源码解析

    目录 序言 背景 MF 基本介绍 应用场景 微前端架构 服务化的 library 和 components ModuleFederationPlugin 源码解析 入口源码 Exposes Remotes Shared 小结 总结 序言 本文是 Webpack ModuleFederationPlugin(后面简称 MF) 源码解析 文章中的第一篇,在此系列文章中,我将带领大家抽丝剥茧.一步步地去解析 MF 源码.当然为了帮助大家理解,可能中间也会涉及到 Webpack 源码中的其它实现,我会根

  • Python中getpass模块无回显输入源码解析

    本文主要讨论了python中getpass模块的相关内容,具体如下. getpass模块 昨天跟学弟吹牛b安利Python标准库官方文档的时候偶然发现了这个模块.仔细一看内容挺少的,只有两个主要api,就花了点时间阅读了一下源码,感觉挺实用的,在这安利给大家. getpass.getpass(prompt='Password: ', stream=None) 调用该函数可以在命令行窗口里面无回显输入密码.参数prompt代表提示字符串,默认是'Password: '.在Unix系统中,strea

  • Python优秀开源项目Rich源码解析的流程分析

    这篇文章对优秀的开源项目Rich的源码进行解析,OMG,盘他.为什么建议阅读源码,有两个原因,第一,单纯学语言很难在实践中灵活应用,通过阅读源码可以看到每个知识点的运用场景,印象会更深,以后写代码的时候就能应用起来:第二,通过阅读优秀的开源代码,可以学习比人的代码规范.设计思路:第三,参与到开源社区,获得更广阔的的发展前景:第四,面试加分项.所以,有时间的话还是建议大家多读读优秀开源项目的源码. 下面进入今天的主题,这个开源项目的名字叫Rich,地址:https://github.com/wil

  • python wsgiref源码解析

    python web开发中http请求的处理流程通常是: web-browser , web-server , wsgi 和 web-application四个环节, 我们学习过基于bottle实现的web-application,也学习了http.server.再完成python3源码中自带的wsgiref的库,就可以拼接最后一个环节wsgi.本文会分下面几个部分: wsgi相关概念 cgi示例 wsgiref源码 wsgi小结 小技巧 wsgi 相关概念 CGI CGI(Common Gat

随机推荐