详解让Python性能起飞的15个技巧

目录
  • 前言
  • 如何测量程序的执行时间
  • 1.使用map()进行函数映射
  • 2.使用set()求交集
  • 3.使用sort()或sorted()排序
  • 4.使用collections.Counter()计数
  • 5.使用列表推导
  • 6.使用join()连接字符串
  • 7.使用x,y=y,x交换变量
  • 8.使用while1取代whileTrue
  • 9.使用装饰器缓存
  • 10.减少点运算符(.)的使用
  • 11.使用for循环取代while循环
  • 12.使用Numba.jit加速计算
  • 13.使用Numpy矢量化数组
  • 14.使用in检查列表成员
  • 15.使用itertools库迭代
  • 结语
    • 1.尽量使用内置库函数
    • 2.尽量使用优秀的第三方库

前言

Python 一直以来被大家所诟病的一点就是执行速度慢,但不可否认的是 Python 依然是我们学习和工作中的一大利器。因此,我们对 Python 呢是“又爱又恨”。

本文总结了一些小 tips 有助于提升 Python 执行速度、优化性能。以下所有技巧都经过我的验证,可放心食用。

先上结论:

  • 使用map()进行函数映射
  • 使用set()求交集
  • 使用sort()sorted()排序
  • 使用collections.Counter()计数
  • 使用列表推导
  • 使用join()连接字符串
  • 使用x, y = y, x交换变量
  • 使用while 1取代while True
  • 使用装饰器缓存
  • 减少点运算符(.)的使用
  • 使用for循环取代while循环
  • 使用Numba.jit加速计算
  • 使用Numpy矢量化数组
  • 使用in检查列表成员
  • 使用itertools库迭代

如何测量程序的执行时间

关于 Python 如何精确地测量程序的执行时间,这个问题看起来简单其实很复杂,因为程序的执行时间受到很多因素的影响,例如操作系统、Python 版本以及相关硬件(CPU 性能、内存读写速度)等。在同一台电脑上运行相同版本的语言时,上述因素就是确定的了,但是程序的睡眠时间依然是变化的,且电脑上正在运行的其他程序也会对实验有干扰,因此严格来说这就是实验不可重复。

我了解到的关于计时比较有代表性的两个库就是timetimeit

其中,time库中有time()perf_counter()以及process_time()三个函数可用来计时(以秒为单位),加后缀_ns表示以纳秒计时(自 Python3.7 始)。在此之前还有clock()函数,但是在 Python3.3 之后被移除了。上述三者的区别如下:

  • time()精度上相对没有那么高,而且受系统的影响,适合表示日期时间或者大程序的计时。
  • perf_counter()适合小一点的程序测试,会计算sleep()时间。
  • process_time()适合小一点的程序测试,不计算sleep()时间。

time库相比,timeit 有两个优点:

  • timeit 会根据您的操作系统和 Python 版本选择最佳计时器。
  • timeit 在计时期间会暂时禁用垃圾回收。

timeit.timeit(stmt='pass', setup='pass', timer=<default timer>, number=1000000, globals=None) 参数说明:

  • stmt='pass':需要计时的语句或者函数。
  • setup='pass':执行stmt之前要运行的代码。通常,它用于导入一些模块或声明一些必要的变量。
  • timer=<default timer>:计时器函数,默认为time.perf_counter()
  • number=1000000:执行计时语句的次数,默认为一百万次。
  • globals=None:指定执行代码的命名空间。

本文所有的计时均采用timeit方法,且采用默认的执行次数一百万次。

为什么要执行一百万次呢?因为我们的测试程序很短,如果不执行这么多次的话,根本看不出差距。

1.使用map()进行函数映射

Exp1:将字符串数组中的小写字母转为大写字母。

测试数组为 oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。

方法一

newlist = []
for word in oldlist:
    newlist.append(word.upper())

方法二

list(map(str.upper, oldlist))

方法一耗时 0.5267724000000005s,方法二耗时 0.41462569999999843s,性能提升 21.29%

2.使用set()求交集

Exp2:求两个list的交集。

测试数组:a = [1,2,3,4,5],b = [2,4,6,8,10]。

方法一

overlaps = []
for x in a:
    for y in b:
        if x == y:
            overlaps.append(x)

方法二

list(set(a) & set(b))

方法一耗时 0.9507264000000006s,方法二耗时 0.6148200999999993s,性能提升 35.33%

关于set()的语法:|&-分别表示求并集、交集、差集。

3.使用sort()或sorted()排序

我们可以通过多种方式对序列进行排序,但其实自己编写排序算法的方法有些得不偿失。因为内置的 sort()sorted() 方法已经足够优秀了,且利用参数key可以实现不同的功能,非常灵活。二者的区别是sort()方法仅被定义在list中,而sorted()是全局方法对所有的可迭代序列都有效。

Exp3:分别使用快排和sort()方法对同一列表排序。

测试数组:lists = [2,1,4,3,0]。

方法一

def quick_sort(lists,i,j):
    if i >= j:
        return list
    pivot = lists[i]
    low = i
    high = j
    while i < j:
        while i < j and lists[j] >= pivot:
            j -= 1
        lists[i]=lists[j]
        while i < j and lists[i] <=pivot:
            i += 1
        lists[j]=lists[i]
    lists[j] = pivot
    quick_sort(lists,low,i-1)
    quick_sort(lists,i+1,high)
    return lists

方法二

lists.sort()

方法一耗时 2.4796975000000003s,方法二耗时 0.05551999999999424s,性能提升 97.76%

顺带一提,sorted()方法耗时 0.1339823999987857s

可以看出,sort()作为list专属的排序方法还是很强的,sorted()虽然比前者慢一点,但是胜在它“不挑食”,它对所有的可迭代序列都有效。

扩展:如何定义sort()sorted()方法的key

1.通过lambda定义

#学生:(姓名,成绩,年龄)
students = [('john', 'A', 15),('jane', 'B', 12),('dave', 'B', 10)]
students.sort(key = lambda student: student[0]) #根据姓名排序
sorted(students, key = lambda student: student[0])

2.通过operator定义

import operator

students = [('john', 'A', 15),('jane', 'B', 12),('dave', 'B', 10)]
students.sort(key=operator.itemgetter(0))
sorted(students, key = operator.itemgetter(1, 0)) #先对成绩排序,再对姓名排序

operatoritemgetter()适用于普通数组排序,attrgetter()适用于对象数组排序

3.通过cmp_to_key()定义,最为灵活

import functools

def cmp(a,b):
    if a[1] != b[1]:
        return -1 if a[1] < b[1] else 1 #先按照成绩升序排序
    elif a[0] != b[0]:
        return -1 if a[0] < b[0] else 1 #成绩相同,按照姓名升序排序
    else:
        return -1 if a[2] > b[2] else 1 #成绩姓名都相同,按照年龄降序排序 

students = [('john', 'A', 15),('john', 'A', 14),('jane', 'B', 12),('dave', 'B', 10)]
sorted(students, key = functools.cmp_to_key(cmp))

4.使用collections.Counter()计数

Exp4:统计字符串中每个字符出现的次数。

测试数组:sentence='life is short, i choose python'。

方法一

counts = {}
for char in sentence:
    counts[char] = counts.get(char, 0) + 1

方法二

from collections import Counter
Counter(sentence)

方法一耗时 2.8105250000000055s,方法二耗时 1.6317423000000062s,性能提升 41.94%

5.使用列表推导

列表推导(list comprehension)短小精悍。在小代码片段中,可能没有太大的区别。但是在大型开发中,它可以节省一些时间。

Exp5:对列表中的奇数求平方,偶数不变。

测试数组:oldlist = range(10)。

方法一

newlist = []
for x in oldlist:
    if x % 2 == 1:
        newlist.append(x**2)

方法二

[x**2 for x in oldlist if x%2 == 1]

方法一耗时 1.5342976000000021s,方法二耗时 1.4181957999999923s,性能提升 7.57%

6.使用 join() 连接字符串

大多数人都习惯使用+来连接字符串。但其实,这种方法非常低效。因为,+操作在每一步中都会创建一个新字符串并复制旧字符串。更好的方法是用 join() 来连接字符串。关于字符串的其他操作,也尽量使用内置函数,如isalpha()isdigit()startswith()endswith()等。

Exp6:将字符串列表中的元素连接起来。

测试数组:oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。

方法一

sentence = ""
for word in oldlist:
    sentence += word

方法二

"".join(oldlist)

方法一耗时 0.27489080000000854s,方法二耗时 0.08166570000000206s,性能提升 70.29%

join还有一个非常舒服的点,就是它可以指定连接的分隔符,举个例子

oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']
sentence = "//".join(oldlist)
print(sentence)

life//is//short//i//choose//python

7.使用x, y = y, x交换变量

Exp6:交换x,y的值。

测试数据:x, y = 100, 200。

方法一

temp = x
x = y
y = temp

方法二

x, y = y, x

方法一耗时 0.027853900000010867s,方法二耗时 0.02398730000000171s,性能提升 13.88%

8.使用while 1取代while True

在不知道确切的循环次数时,常规方法是使用while True进行无限循环,在代码块中判断是否满足循环终止条件。虽然这样做没有任何问题,但while 1的执行速度比while True更快。因为它是一种数值转换,可以更快地生成输出。

Exp8:分别用while 1while True循环 100 次。

方法一

i = 0
while True:
    i += 1
    if i > 100:
        break

方法二

i = 0
while 1:
    i += 1
    if i > 100:
        break

方法一耗时 3.679268300000004s,方法二耗时 3.607847499999991s,性能提升1.94%

9.使用装饰器缓存

将文件存储在高速缓存中有助于快速恢复功能。Python 支持装饰器缓存,该缓存在内存中维护特定类型的缓存,以实现最佳软件驱动速度。我们使用lru_cache装饰器来为斐波那契函数提供缓存功能,在使用fibonacci递归函数时,存在大量的重复计算,例如fibonacci(1)fibonacci(2)就运行了很多次。而在使用了lru_cache后,所有的重复计算只会执行一次,从而大大提高程序的执行效率。

Exp9:求斐波那契数列。

测试数据:fibonacci(7)。

方法一

def fibonacci(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    return fibonacci(n - 1) + fibonacci(n-2)

方法二

import functools

@functools.lru_cache(maxsize=128)
def fibonacci(n):
    if n == 0:
        return 0
    elif n == 1:
        return 1
    return fibonacci(n - 1) + fibonacci(n-2)

方法一耗时 3.955014900000009s,方法二耗时 0.05077979999998661s,性能提升 98.72%

注意事项:

  • 缓存是按照参数作为键,也就说在参数不变时,被lru_cache装饰的函数只会执行一次。
  • 所有参数必须可哈希,例如list不能作为被lru_cache装饰的函数的参数。
import functools

@functools.lru_cache(maxsize=100)
def demo(a, b):
    print('我被执行了')
    return a + b
if __name__ == '__main__':
    demo(1, 2)
    demo(1, 2)

我被执行了(执行了两次demo(1, 2),却只输出一次)

from functools import lru_cache

@lru_cache(maxsize=100)
def list_sum(nums: list):
    return sum(nums)

if __name__ == '__main__':
    list_sum([1, 2, 3, 4, 5])

TypeError: unhashable type: 'list'

functools.lru_cache(maxsize=128, typed=False)的两个可选参数:

  • maxsize代表缓存的内存占用值,超过这个值之后,就的结果就会被释放,然后将新的计算结果进行缓存,其值应当设为 2 的幂。
  • typed若为True,则会把不同的参数类型得到的结果分开保存。

10.减少点运算符(.)的使用

点运算符(.)用来访问对象的属性或方法,这会引起程序使用__getattribute__()__getattr__()进行字典查找,从而带来不必要的开销。尤其注意,在循环当中,更要减少点运算符的使用,应该将它移到循环外处理。

这启发我们应该尽量使用from ... import ...这种方式来导包,而不是在需要使用某方法时通过点运算符来获取。其实不光是点运算符,其他很多不必要的运算我们都尽量移到循环外处理。

Exp10:将字符串数组中的小写字母转为大写字母。

测试数组为 oldlist = ['life', 'is', 'short', 'i', 'choose', 'python']。

方法一

newlist = []
for word in oldlist:
    newlist.append(str.upper(word))

方法二

newlist = []
upper = str.upper
for word in oldlist:
    newlist.append(upper(word))

方法一耗时 0.7235491999999795s,方法二耗时 0.5475435999999831s,性能提升 24.33%

11.使用for循环取代while循环

当我们知道具体要循环多少次时,使用for循环比使用while循环更好。

Exp12:使用forwhile分别循环 100 次。

方法一

i = 0
while i < 100:
    i += 1

方法二

for _ in range(100):
    pass

方法一耗时 3.894683299999997s,方法二耗时 1.0198077999999953s,性能提升73.82%

12.使用Numba.jit加速计算

Numba 可以将 Python 函数编译码为机器码执行,大大提高代码执行速度,甚至可以接近 C 或 FORTRAN 的速度。它能和 Numpy 配合使用,在 for 循环中或存在大量计算时能显著地提高执行效率。

Exp12:求从 1 加到 100 的和。

方法一

def my_sum(n):
    x = 0
    for i in range(1, n+1):
        x += i
    return x

方法二

from numba import jit

@jit(nopython=True)
def numba_sum(n):
    x = 0
    for i in range(1, n+1):
        x += i
    return x

方法一耗时 3.7199997000000167s,方法二耗时 0.23769430000001535s,性能提升 93.61%

13.使用Numpy矢量化数组

矢量化是 NumPy 中的一种强大功能,可以将操作表达为在整个数组上而不是在各个元素上发生。这种用数组表达式替换显式循环的做法通常称为矢量化。

在 Python 中循环数组或任何数据结构时,会涉及很多开销。NumPy 中的向量化操作将内部循环委托给高度优化的 C 和 Fortran 函数,从而使 Python 代码更加快速。

Exp13:两个长度相同的序列逐元素相乘。

测试数组:a = [1,2,3,4,5], b = [2,4,6,8,10]

方法一

[a[i]*b[i] for i in range(len(a))]

方法二

import numpy as np
a = np.array([1,2,3,4,5])
b = np.array([2,4,6,8,10])
a*b

方法一耗时 0.6706845000000214s,方法二耗时 0.3070132000000001s,性能提升 54.22%

14.使用in检查列表成员

若要检查列表中是否包含某成员,通常使用in关键字更快。

Exp14:检查列表中是否包含某成员。

测试数组:lists = ['life', 'is', 'short', 'i', 'choose', 'python']

方法一

def check_member(target, lists):
    for member in lists:
        if member == target:
            return True
    return False

方法二

if target in lists:
    pass

方法一耗时 0.16038449999999216s,方法二耗时 0.04139250000000061s,性能提升 74.19%

15.使用itertools库迭代

itertools是用来操作迭代器的一个模块,其函数主要可以分为三类:无限迭代器、有限迭代器、组合迭代器。

Exp15:返回列表的全排列。

测试数组:["Alice", "Bob", "Carol"]

方法一

def permutations(lst):
    if len(lst) == 1 or len(lst) == 0:
        return [lst]
    result = []
    for i in lst:
        temp_lst = lst[:]
        temp_lst.remove(i)
        temp = permutations(temp_lst)
        for j in temp:
            j.insert(0, i)
            result.append(j)
    return result

方法二

import itertools
itertools.permutations(["Alice", "Bob", "Carol"])

方法一耗时 3.867292899999484s,方法二耗时 0.3875405000007959s,性能提升 89.98%

扩展itertools库详解:点击此链接

结语

根据上面的测试数据,我绘制了下面这张实验结果图,可以更加直观的看出不同方法带来的性能差异。

从图中可以看出,大部分的技巧所带来的性能增幅还是比较可观的,但也有少部分技巧的增幅较小(例如编号5、7、8,其中,第 8 条的两种方法几乎没有差异)。

总结下来,我觉得其实就是下面这两条原则:

1.尽量使用内置库函数

内置库函数由专业的开发人员编写并经过了多次测试,很多库函数的底层是用C语言开发的。因此,这些函数总体来说是非常高效的(比如sort()join()等),自己编写的方法很难超越它们,还不如省省功夫,不要重复造轮子了,何况你造的轮子可能更差。所以,如果函数库中已经存在该函数,就直接拿来用。

2.尽量使用优秀的第三方库

有很多优秀的第三方库,它们的底层可能是用 C 和 Fortran 来实现的,像这样的库用起来绝对不会吃亏,比如前文提到的 Numpy 和 Numba,它们带来的提升都是非常惊人的。类似这样的库还有很多,比如Cython、PyPy等,这里我只是抛砖引玉。

其实加快 Python 代码执行速度的方法还有很多,比如避免使用全局变量、使用最新版本、使用合适的数据结构、利用if条件的惰性等等,我这里就不一一例举了。这些方法都需要我们亲身去实践才会有深刻的感受和理解,但最根本的方法就是保持我们对编程的热情和对最佳实践的追求,这才是我们能不断突破自我、勇攀高峰的不竭动力源泉!

以上就是详解让Python性能起飞的15个技巧的详细内容,更多关于Python性能提升技巧的资料请关注我们其它相关文章!

(0)

相关推荐

  • 提升 Python 代码运行速度的6个技巧

    其实,Python 比我们想象的运行的要快.我们之所以有先入为主的认为Python运行慢,可能是我们平常的误用和缺乏使用技巧知识. 接下来让我们看看如何用一些简单的Trick来提高我们程序的运行性能 1.使用内置函数 Python中的许多内置函数都是用C实现的,并且经过了很好的优化.因此,如果熟悉这些内置函数,就可以提高Python代码的性能.一些常用的内置函数有sum().len().map().max()等. 假设我们有一个包含单词的列表,我们希望每个单词的首字母均变为大写.此时使用map(

  • Python 性能优化技巧总结

    1.使用测量工具,量化性能才能改进性能,常用的timeit和memory_profiler,此外还有profile.cProfile.hotshot等,memory_profiler用了psutil,所以不能跟踪cpython的扩展: 2.用C来解决费时的处理,c是效率的代名词,也是python用来解决效率问题的主要途径,甚至有时候我都觉得python是c的完美搭档.常用的是Cython,直接把py代码c化然后又能像使用py包一样使用,其次是ctypes,效率最最高的存在,最后还有CPython

  • Python 代码性能优化技巧分享

    如何进行 Python 性能优化,是本文探讨的主要问题.本文会涉及常见的代码优化方法,性能优化工具的使用以及如何诊断代码的性能瓶颈等内容,希望可以给 Python 开发人员一定的参考. Python 代码优化常见技巧 代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构.优化.扩展以及文档相关的事情通常需要消耗 80% 的工作量.优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率. 改进算法,选择合适的数据结构 一个

  • 提升Python运行速度的5个小技巧

    目录 1. 选择合适的数据结构 2. 善用强大的内置函数和第三方库 3. 少用循环 4. 避免循环重复计算 5. 少用内存.少用全局变量 总结 官方原文,代码均可运行 Python 是世界上使用最广泛的编程语言之一.它是一种解释型高级通用编程语言,具有广泛的用途,几乎可以将其用于所有事物.其以简单的语法.优雅的代码和丰富的第三方库而闻名.python除了有很多优点外,但在速度上还有一个非常大的缺点. 虽然Python代码运行缓慢,但可以通过下面分享的5个小技巧提升Python运行速度! 首先,定

  • Python性能优化技巧

    Python是一门非常酷的语言,因为很少的Python代码可以在短时间内做很多事情,并且,Python很容易就能支持多任务和多重处理. py 1.关键代码可以依赖于扩展包 Python使许多编程任务变得简单,但是对于很关键的任务并不总是提供最好的性能.使用C.C++或者机器语言扩展包来执行关键任务能极大改善性能.这些包是依赖于平台的,也就是说,你必须使用特定的.与你使用的平台相关的包.简而言之,该解决方案提供了一些应用程序的可移植性,以换取性能,您可以获得只有通过直接向底层主机编程.下面这些扩展

  • 分享18 个 Python 高效编程技巧

    目录 01 交换变量 02 字典推导(Dictionary comprehensions)和集合推导(Set comprehensions) 03 计数时使用Counter计数对象. 04 漂亮的打印出JSON 05 解决FizzBuzz 06 if 语句在行内 07 连接 08 数值比较 09 同时迭代两个列表 10 带索引的列表迭代 11 列表推导式 12 字典推导 13 初始化列表的值 14 列表转换为字符串 15 从字典中获取元素 16 获取列表的子集 17 迭代工具 18 False

  • Python性能调优的十个小技巧总结

    1 多多使用列表生成式 替换下面代码: cube_numbers = [] for n in range(0,10): if n % 2 == 1: cube_numbers.append(n**3) 为列表生成式写法: cube_numbers = [n**3 for n in range(1,10) if n%2 == 1] 2 内置函数 尽可能多使用下面这些内置函数: 3 尽可能使用生成器 单机处理较大数据量时,生成器往往很有用,因为它是分小片逐次读取,最大程度节省内存,如下网页爬取时使用

  • 详解让Python性能起飞的15个技巧

    目录 前言 如何测量程序的执行时间 1.使用map()进行函数映射 2.使用set()求交集 3.使用sort()或sorted()排序 4.使用collections.Counter()计数 5.使用列表推导 6.使用join()连接字符串 7.使用x,y=y,x交换变量 8.使用while1取代whileTrue 9.使用装饰器缓存 10.减少点运算符(.)的使用 11.使用for循环取代while循环 12.使用Numba.jit加速计算 13.使用Numpy矢量化数组 14.使用in检查

  • 详解C/C++性能优化背后的方法论TMAM

    目录 前言 一.示例 二.CPU 流水线介绍 三.自顶向下分析(TMAM) 3.1.基础分类 3.1.1.Retiring 3.1.2.Bad Speculation 3.1.3.Front-End-Boun 3.1.4.Back-End-Bound 3.3.如何针对不同类别进行优化? 3.3.1.Front-End Bound 3.3.2.Back-End Bound 3.3.3.Bad Speculation分支预测 四.写在最后 五.CPU知识充电站 前言 性能优化的难点在于找出关键的性能

  • 详解用Python进行时间序列预测的7种方法

    数据准备 数据集(JetRail高铁的乘客数量)下载. 假设要解决一个时序问题:根据过往两年的数据(2012 年 8 月至 2014 年 8月),需要用这些数据预测接下来 7 个月的乘客数量. import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('train.csv') df.head() df.shape 依照上面的代码,我们获得了 2012-2014 年两年每个小时的乘

  • 详解基于python的全局与局部序列比对的实现(DNA)

    程序能实现什么 a.完成gap值的自定义输入以及两条需比对序列的输入 b.完成得分矩阵的计算及输出 c.输出序列比对结果 d.使用matplotlib对得分矩阵路径的绘制 一.实现步骤 1.用户输入步骤 a.输入自定义的gap值 b.输入需要比对的碱基序列1(A,T,C,G)换行表示输入完成 b.输入需要比对的碱基序列2(A,T,C,G)换行表示输入完成 输入(示例): 2.代码实现步骤 1.获取到用户输入的gap,s以及t 2.调用构建得分矩阵函数,得到得分矩阵以及方向矩阵 3.将得到的得分矩

  • 详解基于python的图像Gabor变换及特征提取

    1.前言 在深度学习出来之前,图像识别领域北有"Gabor帮主",南有"SIFT慕容小哥".目前,深度学习技术可以利用CNN网络和大数据样本搞事情,从而取替"Gabor帮主"和"SIFT慕容小哥"的江湖地位.但,在没有大数据和算力支撑的"乡村小镇"地带,或是对付"刁民小辈","Gabor帮主"可以大显身手,具有不可撼动的地位.IT武林中,有基于C++和OpenCV,或

  • 详解在Python中创建条形图追赶动画

    目录 前言 方法一:使用pause()函数 方法二:使用FuncAnimation()函数 线性图动画 Python中的条形图追赶动画 Python中的散点图动画: 条形图追赶的水平移动 前言 动画是使可视化更具吸引力和用户吸引力的好方法.它帮助我们以有意义的方式展示数据可视化.Python 帮助我们使用现有的强大 Python 库创建动画可视化.Matplotlib是一个非常流行的数据可视化库,通常用于数据的图形表示以及使用内置函数的动画. 使用 Matplotlib 创建动画有两种方法: 使

  • 详解使用python的logging模块在stdout输出的两种方法

    详解使用python的logging模块在stdout输出 前言: 使用python的logging模块时,除了想将日志记录在文件中外,还希望在前台执行python脚本时,可以将日志直接输出到标准输出std.out中. 实现 logging模块可以有两种方法实现该功能: 方案一:basicconfig import sys import logging logging.basicConfig(stream=sys.stdout, level=logging.DEBUG) 方案二:handler

  • 基于YUV 数据格式详解及python实现方式

    YUV 数据格式概览 YUV 的原理是把亮度与色度分离,使用 Y.U.V 分别表示亮度,以及蓝色通道与亮度的差值和红色通道与亮度的差值.其中 Y 信号分量除了表示亮度 (luma) 信号外,还含有较多的绿色通道量,单纯的 Y 分量可以显示出完整的黑白图像.U.V 分量分别表示蓝 (blue).红 (red) 分量信号,它们只含有色彩 (chrominance/color) 信息,所以 YUV 也称为 YCbCr,C 意思可以理解为 (component 或者 color). 维基百科上的 RGB

  • 详解用Python爬虫获取百度企业信用中企业基本信息

    一.背景 希望根据企业名称查询其经纬度,所在的省份.城市等信息.直接将企业名称传给百度地图提供的API,得到的经纬度是非常不准确的,因此希望获取企业完整的地理位置,这样传给API后结果会更加准确. 百度企业信用提供了企业基本信息查询的功能.希望通过Python爬虫获取企业基本信息.目前已基本实现了这一需求. 本文最后会提供具体的代码.代码仅供学习参考,希望不要恶意爬取数据! 二.分析 以苏宁为例.输入"江苏苏宁"后,查询结果如下: 经过分析,这里列示的企业信息是用JavaScript动

  • 详解在Python中使用Torchmoji将文本转换为表情符号

    很难找到关于如何使用Python使用DeepMoji的教程.我已经尝试了几次,后来又出现了几次错误,于是决定使用替代版本:torchMoji. TorchMoji是DeepMoji的pyTorch实现,可以在这里找到:https://github.com/huggingface/torchMoji 事实上,我还没有找到一个关于如何将文本转换为表情符号的教程.如果你也没找到,那么本文就是一个了. 安装 这些代码并不完全是我的写的,源代码可以在这个链接上找到. pip3 install torch=

随机推荐