如何使用python对图片进行批量压缩详解

2025-02-03 07:09:43

前言

最近在研究怎么对图片资源进行无损压缩，网上也找了一些资料。总而言之，收获不少，所以想对最近的学习做个总结。

无损压缩其实是相对而言的，目的是为了减小图片资源的内存大小但又不影响图片的显示质量。下面我将介绍两种批量压缩图片的方法，方法一是使用python和Pillow模块对图片进行压缩，这个方法对jpeg格式的图片有非常高的压缩效率，但该方法不太适合对png图片进行压缩。另一个方式是使用Python和Selenium模块操纵Squoosh批量压缩图片。

使用Python和Pillow模块压缩图片

Pillow是Python上一个功能非常强大的图形处理库，若本地还没安装，可以通过指令：pip install Pillow安装。使用Pillow进行压缩的策略大致总结为三个：1、优化flag，2、渐进式JPEG，3、JPEG动态质量。

我们先用Python写一个简单的保存图片的例子：

from PIL import Image
from io import StringIO
import dynamic_quality

im = Image.open("photo.jpg")
print(im.format,im.size,im.mode)

new_photo = im.copy()
new_photo.thumbnail(im.size,resample=Image.ANTIALIAS)
save_args = {'format':im.format}
if im.format=='JPEG':
    save_args['quality'].value=85

new_photo.save("copy_photo.jpg",**save_args)

1、优化flag

开启optimize设置，这是以CPU耗时为代价节省额外的文件大小，由于本质没变，对图片质量没有丝毫影响。

...
if im.format=='JPEG':
    save_args['quality'].value=85
    save_args['optimize']=True
...

2、渐进式JPEG

当我们将一张图片保存为 JPEG 时，你可以从下面的选项中选择不同的类型：

标准型： JPEG 图片自上而下载入。
渐进式： JPEG 图片从模糊到清晰载入。

渐进式的选项可以在 Pillow 中轻松的启用 (progressive=True)。渐进式文件的被打包时会有一个小幅的压缩。

...
if im.format=='JPEG':
    save_args['quality'].value=85
    save_args['optimize']=True
    save_args['progressive=True']=True
...

3、JPEG动态质量

最广为人知的减小 JPEG 文件大小的方法就是设置 quality。很多应用保存 JPEG 时都会设置一个特定的质量数值。

质量其实是个很抽象的概念。实际上，一张 JPEG 图片的每个颜色通道都有不同的质量。质量等级从 0 到 100 在不同的颜色通道上都对应不同的量化表，同时也决定了有多少信息会丢失。

在信号域量化是 JPEG 编码中失去信息的第一个步骤。

我们可以动态地为每一张图片设置最优的质量等级，在质量和文件大小之间找到一个平衡点。我们有以下两种方法可以做到这点：

Bottom-up： 这些算法是在 8x8 像素块级别上处理图片来生成调优量化表的。它们会同时计算理论质量丢失量和和人眼视觉信息丢失量。

Top-down： 这些算法是将一整张图片和它原版进行对比，然后检测出丢失了多少信息。通过不断地用不同的质量参数生成候选图片，然后选择丢失量最小的那一张。

我们选择第二种方法：使用二分法在不同的质量等级下生成候选图片，然后使用 pyssim 计算它的结构相似矩阵 (SSIM) 来评估每张候选图片损失的质量，直到这个值达到非静态可配置的阈值为止。这个方法让我们可以有选择地降低文件大小（和文件质量），但是只适用于那些即使降低质量用户也察觉不到的图片。

下面是计算动态质量的代码dynamic_quality.py：

import PIL.Image
from math import log
from SSIM_PIL import compare_ssim

def get_ssim_at_quality(photo, quality):
    """Return the ssim for this JPEG image saved at the specified quality"""
    ssim_photo = "tmp.jpg"
    # optimize is omitted here as it doesn't affect
    # quality but requires additional memory and cpu
    photo.save(ssim_photo, format="JPEG", quality=quality, progressive=True)
    ssim_score = compare_ssim(photo, PIL.Image.open(ssim_photo))
    return ssim_score

def _ssim_iteration_count(lo, hi):
    """Return the depth of the binary search tree for this range"""
    if lo >= hi:
        return 0
    else:
        return int(log(hi - lo, 2)) + 1

def jpeg_dynamic_quality(original_photo):
    """Return an integer representing the quality that this JPEG image should be
    saved at to attain the quality threshold specified for this photo class.

    Args:
        original_photo - a prepared PIL JPEG image (only JPEG is supported)
    """
    ssim_goal = 0.95
    hi = 85
    lo = 80

    # working on a smaller size image doesn't give worse results but is faster
    # changing this value requires updating the calculated thresholds
    photo = original_photo.resize((400, 400))

    # if not _should_use_dynamic_quality():
    #     default_ssim = get_ssim_at_quality(photo, hi)
    #     return hi, default_ssim

    # 95 is the highest useful value for JPEG. Higher values cause different behavior
    # Used to establish the image's intrinsic ssim without encoder artifacts
    normalized_ssim = get_ssim_at_quality(photo, 95)
    selected_quality = selected_ssim = None

    # loop bisection. ssim function increases monotonically so this will converge
    for i in range(_ssim_iteration_count(lo, hi)):
        curr_quality = (lo + hi) // 2
        curr_ssim = get_ssim_at_quality(photo, curr_quality)
        ssim_ratio = curr_ssim / normalized_ssim

        if ssim_ratio >= ssim_goal:
            # continue to check whether a lower quality level also exceeds the goal
            selected_quality = curr_quality
            selected_ssim = curr_ssim
            hi = curr_quality
        else:
            lo = curr_quality

    if selected_quality:
        return selected_quality, selected_ssim
    else:
        default_ssim = get_ssim_at_quality(photo, hi)
        return hi, default_ssim

然后在下面的代码中引用计算动态质量的方法：

...
if im.format=='JPEG':
    save_args['quality'],value=dynamic_quality.jpeg_dynamic_quality(im)
    save_args['optimize']=True
    save_args['progressive']=True
...

使用Python和Selenium模块操纵Squoosh批量压缩图片

Squoosh 是谷歌发布的一款开源的图片在线压缩服务（伪），虽然需要用浏览器打开，但其实是一个整合了许多命令行工具的前端界面，调用的是本地的计算资源，所以只要打开过Squoosh一次，之后都会秒开，并且离线使用。不过最大的缺点就是不可以批量处理，如果我们要处理大量的图片资源，一张张地进行压缩处理将会消耗大量的人力成本和时间成本，这明显是不能接受的。我们要解决的问题就是写一个脚本来模拟浏览器的操作，使我们的双手得到解放。

Python 调用 Selenium

这是 Squoosh 的主界面，Select an Image 其实是一个输入框，那我们直接用 Selenium 把本地图片的路径输入进去就行了：

输入图片路径之后就会默认压缩成 75% 质量的 MozJPEG，我觉得无论是压缩比和质量都很不错，所以就没有改，等待页面加载完成之后就直接下载：

我们可以认为出现 "..% smaller" 就算是压缩完成，这时候直接点击右边的下载按钮即可。

代码：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
import os
import re
driver = webdriver.Chrome('C:/Users/admin/AppData/Local/Google/Chrome/Application/chromedriver.exe')
# 列出目录下所有的图片，存在 images 这个列表中
images = os.listdir('C:/Users/admin/Pictures/Saved Pictures')
# 处理所有图片
for i in range(len(images)):
    # 构建图片路径
    path = 'C:/Users/admin/Pictures/Saved Pictures/' + images[i]
    # 尝试处理所有图片
    try:
        # 打开 Squoosh
        driver.get('https://squoosh.app')
        # 找到输入框
        input_box = driver.find_element_by_xpath('.//input[@class="_2zg9i"]')
        # 输入图片路径
        input_box.send_keys(path)
        #设置图片格式
        select1 = Select(driver.find_elements_by_css_selector('select')[-1])
        if re.match('.*.png',images[i]):
            select1.select_by_value("png")
        if re.match('.*.jpg',images[i]):
            select1.select_by_value("mozjpeg")

        # 等待出现 'smaller'字样，10秒不出现则视为处理失败
        locator = (By.XPATH, './/span[@class="_1eNmr _1U8bE"][last()]')
        WebDriverWait(driver, 25).until(EC.text_to_be_present_in_element(locator, 'smaller'))

        # 找到下载按钮
        button = driver.find_elements_by_xpath('.//a[@title="Download"]')[-1]
        # 点击下载按钮
        button.click()
    # 输出处理失败的图片路径
    except:
        print('*'*30)
        print('Error: '+ path +' failed!')
        print('*'*30)
        continue

总结

到此这篇关于如何使用python对图片进行批量压缩的文章就介绍到这了,更多相关python图片批量压缩内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Python实现批量压缩图片

本文为大家分享了Python实现批量压缩图片的具体代码,供大家参考,具体内容如下 # -*- coding: utf-8 -*- """ __author__= 'Du' __creation_time__= '2018/1/5 10:06' """ import os from PIL import Image import glob DIR = 'C:/Users/Public/Pictures/Sample Pictures/' class
python利用Guetzli批量压缩图片

Google 又开源了,这次开源了一款图像算法工具 Guetzli.Guetzli,在瑞士德语中是"cookie(曲奇)"的意思,是一个针对数码图像和网页图像的 JPEG 编码器,能够通过产生更小的 JPEG 文件来达到更快的在线体验,并且同时保持与当前浏览器,图像处理应用和 JPEG 标准的兼容性.Google 称 Guetzli 创建高质量的 JPEG 图像文件的大小比当前的压缩方法要再小 35%. 今天玩了下谷歌的开源图片压缩工具Guetzli,发现单张图片压缩效果还是不错的,就
python实现图片批量压缩

项目中大量用到图片加载,由于图片太大,加载速度很慢,因此需要对文件进行统一压缩第一种一:安装包 python -m pip install Pillow 二:导入包 from PIL import Image import os 三:获取图片文件的大小 def get_size(file): # 获取文件大小:KB size = os.path.getsize(file) return size / 1024 四:输出文件夹下的文件 dir_path = r'file_path' items
python 无损批量压缩图片（支持保留图片信息）的示例

由于云盘空间有限,照片尺寸也是很大,所以写个Python程序压缩一下照片,腾出一些云盘空间 1.批量压缩照片新建 photo_compress.py 代码如下 # -*- coding: utf-8 -*- """脚本功能说明:使用 tinypng api,一键批量压缩指定文件(夹)所有文件""" import os import sys from concurrent.futures import ThreadPoolExecutor, Pr
python实现图片批量压缩程序

本文实例为大家分享了python实现图片批量压缩程序的具体代码,供大家参考,具体内容如下说明运行环境:Win10 Pycharm 程序没有用到面向对象编程方法,只是简单的面向过程设计用到的模块:PIL.os.sys 使用方法: 在Pycharm的terminal中输入"python xxx.py source_dir dest_dir"就可以把source_dir中的图片文件进行压缩并保存到dest_dir中源码 from PIL import Image import os
python 批量压缩图片的脚本

简介用Python批量压缩图片,把文件夹或图片直接拖入即可需要 Needs Python 3 Pillow (用pip install pillow来安装即可) 用法 Usage 把文件夹或图片直接拖入即可.如果拖入的是文件夹,则会遍历子文件夹把所有图片都压缩了. 注意,压缩后的文件会直接替换原来的文件,文件名不变,尺寸不变,只改变压缩质量. 文件的开头有两个变量: SIZE_CUT = 4 表示大于4MB的图片都会进行压缩 QUALITY = 90 表示压缩质量90,这个质量基本人眼是看不
python 实现图片批量压缩的示例

项目中大量用到图片加载,由于图片太大,加载速度很慢,因此需要对文件进行统一压缩一:导入包 from PIL import Image import os 二:获取图片文件的大小 def get_size(file): # 获取文件大小:KB size = os.path.getsize(file) return size / 1024 三:拼接输出文件地址 def get_outfile(infile, outfile): if outfile: return outfile dir, suf
如何使用python对图片进行批量压缩详解

目录前言使用Python和Pillow模块压缩图片 1.优化flag 2.渐进式JPEG 3.JPEG动态质量使用Python和Selenium模块操纵Squoosh批量压缩图片 Python 调用 Selenium 总结前言最近在研究怎么对图片资源进行无损压缩,网上也找了一些资料.总而言之,收获不少,所以想对最近的学习做个总结. 无损压缩其实是相对而言的,目的是为了减小图片资源的内存大小但又不影响图片的显示质量.下面我将介绍两种批量压缩图片的方法,方法一是使用python和Pillo
Python模块文件结构代码详解

本文研究的主要是Python模块文件结构的相关内容,具体如下. Python文件结构文件结构(范例全文) #/usr/bin/env python "this is a test module" import sys import os debug = True class FooClass (object): "Foo class" pass def test(): "test function" foo = FooClass() if de
python MySQLdb使用教程详解

本文主要内容python MySQLdb数据库批量插入insert,更新update的: 1.python MySQLdb的使用,写了一个基类让其他的sqldb继承这样比较方便,数据库的ip, port等信息使用json配置文件 2.常见的查找,批量插入更新下面贴出基类代码: # _*_ coding:utf-8 _*_ import MySQLdb import json import codecs # 这个自己改一下啊 from utils.JsonUtil import get_json
Python基础之内置模块详解

一.os import os # 1. 获取当前脚本绝对路径 """ abs_path = os.path.abspath(__file__) print(abs_path) """ # 2. 获取当前文件的上级目录 """ base_path = os.path.dirname( os.path.dirname(路径) ) print(base_path) """ # 3. 路径拼接
Python实现批量压缩文件/文件夹zipfile的使用

目录 [Python压缩文件夹]导入"zipfile"模块 [python压缩文件]导入"zipfile"模块补充 zipfile是python里用来做zip格式编码的压缩和解压缩的,由于是很常见的zip格式,所以这个模块使用频率也是比较高的, 在这里对zipfile的使用方法做一些记录.即方便自己也方便别人. Python zipfile模块用来做zip格式编码的压缩和解压缩的,要进行相关操作,首先需要实例化一个 ZipFile 对象.ZipFile 接受一个字
Python 机器学习之线性回归详解分析

为了检验自己前期对机器学习中线性回归部分的掌握程度并找出自己在学习中存在的问题,我使用C语言简单实现了单变量简单线性回归. 本文对自己使用C语言实现单变量线性回归过程中遇到的问题和心得做出总结. 线性回归线性回归是机器学习和统计学中最基础和最广泛应用的模型,是一种对自变量和因变量之间关系进行建模的回归分析. 代码概述本次实现的线性回归为单变量的简单线性回归,模型中含有两个参数:变量系数w.偏置q. 训练数据为自己使用随机数生成的100个随机数据并将其保存在数组中.采用批量梯度下降法训练模型,
Python批量操作Excel文件详解

目录批量操作 OS模块介绍 OS模块基本操作获取当前工作路径获取一个文件夹下的所有文件名对文件名进行重命名创建一个文件夹删除一个文件夹删除一个文件利用OS模块进行批量操作批量读取一个文件下的多个文件批量创建文件夹批量重命名文件其他批量操作批量合并多个文件将一份文件按照指定列拆分成多个文件批量操作 OS模块介绍 OS的全称是Operation System,指操作系统.在Python里面OS模块中主要提供了与操作系统即电脑系统之间进行交互的一些功能.我们很多的自动化操
基于Python实现自动扫雷详解

目录准备实现思路窗体截取雷块分割雷块识别扫雷算法实现用Python+OpenCV实现了自动扫雷,突破世界记录,我们先来看一下效果吧. 中级 - 0.74秒 3BV/S=60.81 相信许多人很早就知道有扫雷这么一款经典的游(显卡测试)戏(软件),更是有不少人曾听说过中国雷圣,也是中国扫雷第一.世界综合排名第二的郭蔚嘉的顶顶大名.扫雷作为一款在Windows9x时代就已经诞生的经典游戏,从过去到现在依然都有着它独特的魅力:快节奏高精准的鼠标操作要求.快速的反应能力.刷新纪录的快感,这
利用Python生成随机验证码详解

目录 1.先搞环境 2.开始码代码 3. 加干扰 4. 加入更多的干扰 5. 验证码 + 随机字符 6. 验证码保存本地(选) 最近感觉被大数据定义成机器人了,随便看个网页都跳验证码. 怎么用python绕验证码是个令人头秃的事情, 我投降!那么今天手把手教大家如何写验证码,去为难别人,让他们头秃. 说错了,其实就是教大家如何通过python代码去生成验证码~~ 1.先搞环境 1.我们需要你电脑有python3.4以上的版本 2.pip安装PIL包 pip install pillow 3.默念
python目标检测yolo2详解及预测代码复现

目录前言实现思路 1.yolo2的预测思路(网络构建思路) 2.先验框的生成 3.利用先验框对网络的输出进行解码 4.进行得分排序与非极大抑制筛选实现结果前言 ……最近在学习yolo1.yolo2和yolo3,写这篇博客主要是为了让自己对yolo2的结构有更加深刻的理解,同时要理解清楚先验框的含义. 尽量配合代码观看会更容易理解. 直接下载实现思路 1.yolo2的预测思路(网络构建思路) YOLOv2使用了一个新的分类网络DarkNet19作为特征提取部分,DarkNet19包含19