七个非常实用的Python工具包总结

2025-10-17 05:41:26

一、Faker

生产环境通常具有实时数据。把它放到测试环境中并不容易。我们必须对从生产到测试环境的数据进行标记化，这通常会将数据转换为乱码。

此外，在欺诈行业，我们需要找出欺诈身份。为了生成假PII（个人可识别信息），我使用了一个名为Faker的包，这是一个很酷的软件包，可以让你创建一个带有地址、名字等的假PII。

以上是一些虚假数据的例子。带有 GAN 假图像的假数据可以给出一个真实的人。

二、Pywebio

我们知道 Flask 适用于 Python 端的表单、UI 和 restapi。然而，如果想要一个简单的表单，Flask就不太适用了。通常用 Pywebio 来创建，它会创建了一个简单、干净的UI。所有的代码都是用普通的python编写的，并且我们不用额外学新东西！

# A simple script to calculate BMI
from pywebio.input import input, FLOAT
from pywebio.output import put_text

def bmi():
    height = input("Input your height(cm)：", type=FLOAT)
    weight = input("Input your weight(kg)：", type=FLOAT)

    BMI = weight / (height / 100) ** 2

    top_status = [(16, 'Severely underweight'), (18.5, 'Underweight'),
                  (25, 'Normal'), (30, 'Overweight'),
                  (35, 'Moderately obese'), (float('inf'), 'Severely obese')]

    for top, status in top_status:
        if BMI <= top:
            put_text('Your BMI: %.1f. Category: %s' % (BMI, status))
            break

if __name__ == '__main__':
    bmi()

在几秒钟内，它转换为一个前端 UI 网页。我们还可以编写一些会话并处理输入和输出，查看他们的文档以获取详细信息。

三、Airflow

Airflow 是我最喜欢的软件包之一，它是一种工作流管理工具，在 MLOPS 中经常被低估和较少使用，它还可以用于特定的执行间隔、重新训练模型、批处理、网站抓取、投资组合跟踪、自定义新闻提要等。

在工作流程方面，选项是无限的，它还可以连接到特定服务的云服务商。代码可以用 python 写，在 UI 上可以看到执行，非常棒。工作流也可以按特定时间间隔进行安排。

四、Loguru

Logger 是我讨厌但又不得不使用的工具，它是调试应用程序的最佳方法之一。但是，logger 里面的日志太多了，让人比较烦。而 Loguru 在某种程度上就比较友好，它虽不能解决所有挑战，但是它很容易添加日志语句并为其添加更多调试。

from loguru import logger

logger.debug("That's it, beautiful and simple logging!")

它还有助于拆分文件并执行清理，因此我们不需要查看所有历史日志。

logger.add("file_1.log", rotation="500 MB")    # Automatically rotate too big file
logger.add("file_2.log", rotation="12:00")     # New file is created each day at noon
logger.add("file_3.log", rotation="1 week")    # Once the file is too old, it's rotated

logger.add("file_X.log", retention="10 days")  # Cleanup after some time

logger.add("file_Y.log", compression="zip")    # Save some loved space

你还可以使用参数 backtrace 来回溯执行。

简而言之，在生产环境中使用这个包来调试应用程序或 AI 模型训练是值得的。

五、Pydash

通常在数据清洗或处理中，我们要处理大量的数据清洗。这些是一些较小的项目，需要时间。例如，如何展平列表？当然，你可以写一个清单，但是如果有一个快速功能来执行这些操作呢？

这就是Pydash闪耀的地方，它成为了我的快速转到库，其中包含一系列python实用程序。

以上只是一个小例子，它包含很多功能，绝对值得一看。

六、Weights & Biases

WANDB是跟踪和可视化机器学习管道最有用的包之一，我最喜欢的部分是他们的central dashboard，它类似于记录器，但可以做更多的事情。

它易于使用，并集成了最流行的库，如 Tensorflow、PyTorch、fastai、huggingface 等。但是，在商业领域使用它时有一些限制，你必须付费订阅。除此之外，它是一个很棒的库。

七、PyCaret

在R中我最喜欢的一个包是caret 包，当我看到 PyCaret 包时，我很兴奋。因为它简化了许多编码，当你想快速做某件事情时可以使用。这个包有很多关于默认参数的选项，可以用不同的度量点运行不同的模型。

Summary

正如本文所说的，我们看到在应用程序开发或数据分析中使用了不同的包，这并不是一份详尽的清单，我会继续为大家分享更多的实用的工具包。

到此这篇关于你肯定不知道这7个非常实用的Python工具包的文章就介绍到这了,更多相关Python工具包内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

详解python使用pip安装第三方库(工具包)速度慢、超时、失败的解决方案

人生苦短,我用python!为什么很多人喜欢用python,因为包多呀,各种调包.但是调包有的时候也调的闹心,因为安装包不是失败就是很慢,很影响自己的工作进度,这里给出一个pip快速安装工具包的办法,希望能帮助到一些新入门python的同学们. 当我们在cmd窗口中使用命令:pip install 包名.文件格式时候常常会出现安装失败的现象,你会看到下载的进度条,但是最后显示当下载到百分之几十的时候窗口中就会出现一堆红字,有如下类似提示: 以上这些图片都显示是python第三方库下载出问题了,
python 使用pygame工具包实现贪吃蛇游戏(多彩版)

今天我们用python和python的工具包pygame来编写一个贪吃蛇的小游戏贪吃蛇游戏功能介绍贪吃蛇的游戏规则如下: 通过上下左右键或者WASD键来移动蛇来,让它吃到食物,每吃到食物,蛇的长度变长,并获得分数.若蛇碰到游戏边际或者自身,则蛇死亡,游戏结束. 游戏设计思路根据游戏规则,我们需要: 1.初始化游戏环境. 2.初始化蛇.食物 3.监听键盘动作 4.蛇的运动,吃食物,是否死亡 5.该局游戏结束,是否还有再玩. 其中的难点在于如何在屏幕上展示蛇的运动,其实我们肉眼所见的蛇的运动
浅析python打包工具distutils、setuptools

python中安装包的方式有很多种: 源码包:python setup.py install 在线安装:pip install 包名(linux) / easy_install 包名(window) python包在开发中十分常见,一般的使用套路是所有的功能做一个python模块包,打包模块,然后发布,安装使用.打包和安装包就是最常见的工作.学习中遇到distutils和setuptools两种打包的工具,学习之后做笔记记录. distutils distutils 是 python 标准库的一
详解Python打包分发工具setuptools

Python打包分发工具setuptools:曾经 Python 的分发工具是 distutils,但它无法定义包之间的依赖关系.setuptools 则是它的增强版,能帮助我们更好的创建和分发 Python 包,尤其是具有复杂依赖关系的包.其通过添加一个基本的依赖系统以及许多相关功能,弥补了该缺陷.他还提供了自动包查询程序,用来自动获取包之间的依赖关系,并完成这些包的安装,大大降低了安装各种包的难度,使之更加方便,将程序打包以后可以可以安装到自己的虚拟环境中,也可以上传到PyPI,这样非常方便
Python程序打包工具py2exe和PyInstaller详解

前言通常执行 python 程序要有相应的 Python 环境,但某些特定场景下,我们可能并不愿意这么麻烦的去配置这些环境(比如将写好的脚本发给客户进行操作),如果可以提前将程序打包成 Windows平台的 .exe 文件或者是Linux下的 .sh 脚本,那么使用起来就会方便很多,py2exe 和 PyInstaller 这两款工具都是干这么个事的,下面以 hello.py 脚本(代码内容如下)为例进行介绍. age = input("How old are you?\n") pr
Python包管理工具pip的15 个使用小技巧

认识pip 众所周知,pip可以对python的第三方库进行安装.更新.卸载等操作,十分方便. pip的全称:package installer for python,也就是Python包管理工具. 可能有些人用了很久pip,但还不清楚包管理工具是个啥. 我们先从Python这门语言说起,Python之所以受欢迎不光是因为它简单易学,更重要的是它有成千上万的宝藏库. 这些库相当于是已经集成好的工具,只要安装就能在Python里使用.它们可以处理各式各样的问题,无需你再造轮子,而且随着社区的不断更
七个非常实用的Python工具包总结

目录一.Faker 二.Pywebio 三.Airflow 四.Loguru 五.Pydash 六.Weights & Biases 七.PyCaret Summary 一.Faker 生产环境通常具有实时数据.把它放到测试环境中并不容易.我们必须对从生产到测试环境的数据进行标记化,这通常会将数据转换为乱码. 此外,在欺诈行业,我们需要找出欺诈身份.为了生成假PII(个人可识别信息),我使用了一个名为Faker的包,这是一个很酷的软件包,可以让你创建一个带有地址.名字等的假PII. 以上是一些
8个实用的Python程序你知道几个

目录 1. 引言 2. 处理句子中的脏话 3.调换字符次序创建新单词 4.创建1000个目录 5.打乱段落中单词字符次序 6. 控制台上绘制图形 7. 使用Python打开记事本 8. 获取电脑的IP地址 9. 使用Python实现关机 10. 总结 1. 引言本文所提到的所有代码都曾经帮助我激发了解决问题的一些思考.不言而喻,如果您想学习编码和提升解决问题的能力,我们可以尝试自己来解决以下问题. 闲话少说,我们直接开始吧. :) 2. 处理句子中的脏话编写一个Python程序,用以实现从句
5款实用的python 工具推荐

Python Tutor Python Tutor 是由 Philip Guo 开发的一个免费教育工具,可帮助学生攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程.通过这个工具,教师或学生可以直接在 Web 浏览器中编写 Python 代码,并逐步可视化地运行程序.如果你不知道代码在内存中是如何运行的,不妨把它拷贝到Tutor里可视化执行一遍,加深理解. 地址:http://www.pythontutor.com/ IPython IPython 是一个 for Human
4种非常实用的python内置数据结构

array Python不仅仅可以使用内置的list实现数组,还支持像C语言那样的指定类型的原生数组array. 很显然,因为list可以存储各种类型的对象,而array只存储一个指定的原生类型,所以当数据量较大时,原生array在内存占用方面要比list小. 而且array不像C语言里那样在定义时就限制了大小,它支持list所支持的各种常用函数.相比之下Python的array更像是C++的vector. from array import array l = list(range(100))
总结几个非常实用的Python库

自带库一.datetime datetime是Python处理日期和时间的标准库. 1.获取当前日期和时间 >>> from datetime import datetime >>> now = datetime.now() >>> print(now) 2021-06-14 09:33:10.460192 >>> print(type(now)) <class 'datetime.datetime'> 2.获取指定日期
6个实用的Python自动化脚本详解

目录 1.将 PDF 转换为音频文件 2.从列表中播放随机音乐 3.不再有书签了 4.智能天气信息 5.长网址变短网址 6.清理下载文件夹每天你都可能会执行许多重复的任务,例如阅读 pdf.播放音乐.查看天气.打开书签.清理文件夹等等,使用自动化脚本,就无需手动一次又一次地完成这些任务,非常方便.而在某种程度上,Python 就是自动化的代名词.今天分享 6 个非常有用的 Python 自动化脚本. 1.将 PDF 转换为音频文件脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 Py
分享3个非常实用的 Python 模块

目录一.Psutil 二.Pendulum 三.Pyfiglet 一.Psutil Python当中的Psutil模块是个跨平台库,它能够轻松获取系统运行的进程和系统利用率,包括CPU.内存.磁盘.网络等信息,它的安装也非常的简单, 命令行: pip install psutil 这里因为整体的篇幅有限,小编就暂时只罗列几个常用的方法,例如我们想要查看一下CPU的利用率 psutil.cpu_percent() 返回的结果表示的是当前系统范围的CPU利用率百分比,如果我们要查看系统中CPU的个
分享一些非常实用的Python小技巧

目录 1.唯一性 2.变位词(相同字母异序词) 3.内存 4.字节大小 5.打印N次字符串 6.首字母大写 7.列表细分 8.压缩 9.计数 10.链式比较 11.逗号分隔 12.元音计数 13.首字母小写 14.展开列表 15.寻找差异 16.输出差异 17.链式函数调用 18. 19.将两个列表转换为字库 20.出现频率最高的元素 21.回文(正反读有一样的字符串) 22.不用if-else语句的计算器 23.随机排序 24.展开列表 1.唯一性以下方法可以检查给定列表是否有重复的地方,可
七个生态系统核心库[python自学收藏]

目录一概述二官网链接三安装指南 3.1.使用已有的发行版本 3.2.使用 pip 安装 3.3.使用pycharm安装 3.4.安装验证四上手应用一概述 Python生态系统的一些核心基础数据分析库: NumPy:支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,包含: 一个强大的N维数组对象 ndarray广播功能函数整合 C/C++/Fortran 代码的工具线性代数.傅里叶变换.随机数生成等功能 SciPy:这也是一个功能强大的科学计算库,用于执行科学
小众实用的Python 爬虫库RoboBrowser

1. 前言大家好,我是安果! 今天推荐一款小众轻量级的爬虫库:RoboBrowser RoboBrowser,Your friendly neighborhood web scraper!由纯 Python 编写,运行无需独立的浏览器,它不仅可以做爬虫,还可以实现 Web 端的自动化项目地址: https://github.com/jmcarp/robobrowser 2. 安装及用法在实战之前,我们先安装依赖库及解析器 PS:官方推荐的解析器是「lxml」 # 安装依赖 pip3 i