深入解析NumPy中的Broadcasting广播机制

2025-04-03 15:27:56

前言

在吴恩达老师的深度学习专项课程中，老师有提到NumPy中的广播机制，同时那一周的测验也有涉及到广播机制的题目。那么，到底什么是NumPy中的广播机制？

官方文档

接下来到了看官方文档的时间。

广播机制概述

让我们探索numpy中一个更高级的概念，这个概念被称为广播。广播展现了NumPy在算术运算期间是如何处理具有不同形状的数组的。受到某些约束，较小的阵列将在较大的阵列上“广播”，以使它们具有相同形状。广播提供了一种数组矢量化操作，从而使得循环在C而不是Python中发生。它无需复制不必要的数据即可完成，并且通常算法的效率还挺高。当然在某些情况下，广播并不是一个好办法，因为它会导致内存使用效率低，从而减慢计算速度。本文通过示例，对广播进行了详尽的介绍。它还提供何时使用广播的提示。

numpy操作通常是逐个元素完成的，这就需要两个数组具有完全相同的形状

Example 1

>>> from numpy import array
>>> a = array([1.0, 2.0, 3.0])
>>> b = array([2.0, 2.0, 2.0])
>>> a * b
array([ 2.,  4.,  6.])

当数组的形状满足某些条件时，numpy的广播规则将放宽这种数组限制。 将数组和标量值在一起运算时，会出现最简单的广播示例：

Example 2

>>> from numpy import array
>>> a = array([1.0,2.0,3.0])
>>> b = 2.0
>>> a * b
array([ 2.,  4.,  6.])

尽管只有一个变量是数组，但是结果和之前的一个代码例子是一样的。我们可以认为其中的标量在算术运算中被拓展成与数组a变量形状相同的数组。例如下图中显示的中拓展的新元素只是原始标量的副本。这种拓展只是概念上的。 numpy的明智之处在于使用原始标量值而不必要创建副本，从而使广播操作尽可能地节省内存提高计算效率。由于上面的代码例子中，乘法过程中标量移动的内存较少，所以在具有一百万个元素数组的Windows 2000上，广播机制与之前的两个数组相加相比大概快10%。

在最简单的广播示例中，标量b被拉伸为与a相同形状的数组，使得这些形状适用于逐元素乘法。

下面的规则决定了两个具有兼容形状的数组是否可以在单个代码段中进行广播。

广播机制规则

广播规则

为了广播，操作中两个阵列的尾轴的大小必须相同，或者其中一个必须是一个。

问题来了，尾轴是什么？

为此我找到了python - numpy broadcasting - explanation of trailing axes - Stack Overflow这篇解答。

If you have two arrays with different dimensions number, say one 1x2x3 and other 2x3, then you compare only the trailing common dimensions, in this case 2x3. But if both your arrays are two-dimensional, then their corresponding sizes have to be either equal or one of them has to be 1.

In your case you have a 2x2 and 4x2 and 4 != 2 and neither 4 or 2 equals 1, so this doesn't work.

假设你有两个不同维度的数组。一个是1x2x3，另一个是2x3，那么只需要比较后面的公共尺寸，在这种情况下为2x3。但是，**如果两个数组都是二维的，则它们的对应大小必须相等或其中之一必须为1 **。

在两个二维数组中2x2和4x2，4！= 2，并且4或2都不等于1，所以广播行不通的。

这个解释应该比较清楚了。

如果不满足此条件，则会引发异常，提示数组的形状不兼容。广播操作创建的结果数组的大小是两个数组中每个维度的最大大小。请注意，该规则并未说明需要具有相同维数的两个数组。如果有一个256 x 256 x 3的RGB值数组，想要按不同的值缩放图像中的每种颜色，则可以将图像乘以具有3个值的一维数组。

Image	(3d array)	256 x	256 x	3
Scale	(1d array)			3
Result	(3d array)	256 x	256 x	3

在下面的示例中，两个数组都具有长度为1的轴，这些轴在广播操作中被扩展为更大的大小。

A	(4d array)	8 x	1 x	6 x	1
B	(3d array)		7 x	1 x	5
Result	(4d array)	8 x	7 x	6 x	5

下面，是几个代码例子和图形表示，有助于使广播规则直观明了。例3将一个一维数组添加到一个二维数组。

Example 3

>>> from numpy import array
>>> a = array([[ 0.0,  0.0,  0.0],
...            [10.0, 10.0, 10.0],
...            [20.0, 20.0, 20.0],
...            [30.0, 30.0, 30.0]])
>>> b = array([1.0, 2.0, 3.0])
>>> a + b
array([[  1.,   2.,   3.],
       [ 11.,  12.,  13.],
       [ 21.,  22.,  23.],
       [ 31.,  32.,  33.]])

如下图2所示，b将拓展维度大小和a一样。在图3中，当b的列维度大于a的时，由于形状不兼容而引发异常。

如果一维数组元素的数量与二维数组列的数量匹配，则将二维数组乘以一维数组将导致广播。

当数组的尾部不相等时，广播将失败，因为无法将第一个数组的行中的值与第二个数组的元素对齐进行逐元素加法。

广播提供了一种获取两个数组的外部乘积（或任何其他外部操作）的便捷方法。下面的示例显示两个1维数组的外部加法运算，其结果与示例3相同。

Example 4

>>> from numpy import array, newaxis
>>> a = array([0.0, 10.0, 20.0, 30.0])
>>> b = array([1.0, 2.0, 3.0])
>>> a[:,newaxis] + b
array([[  1.,   2.,   3.],
       [ 11.,  12.,  13.],
       [ 21.,  22.,  23.],
       [ 31.,  32.,  33.]])

在这里，newaxis索引运算符将一个新轴插入，使其成为二维4x1数组。图4说明了两个阵列的拉伸以产生所需的4x3输出阵列。

在这里例子里是b = array([1.0, 2.0, 3.0]),但是下图中是0,1,2，emmmm…尊重原文吧！

在某些情况下，广播会拉伸两个阵列以形成一个比任何一个初始阵列都大的输出阵列。

总结

以上是对官方文档的翻译，总的来说广播机制主要是以下几点：

效率较快，性能较好
广播时，操作中两个数组的尾轴的大小必须相同，或者其中之一必须是1
如果两个数组都是二维的，则它们的对应大小必须相等或其中之一必须为1

通过这篇文章，你是否了解了NumPy的广播机制呢？更多相关NumPy Broadcasting广播机制内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

numpy数组广播的机制

numpy数组的广播功能强大,但是也同时让人疑惑不解,现在让我们来谈谈其中的原理. 广播原则: 如果两个数组的后缘维度(即:从末尾开始算起的维度)的轴长相符或其中一方的长度为1,则认为它们是广播兼容的,广播会在缺失和(或)长度为1的轴上进行. 上面的原则很重要,是广播的指导思想,下面我们来看看例子. 1.其实在最简单的数组与标量数字之间的运算就存在广播,只是我们把它看作理所当然了. 2.再看下一个例子,这个大家都会一致认为这是广播了根据广播原则:arr1的shape为(4,1),arr2的sh
Numpy数组的广播机制的实现

前言 Numpy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作(矢量化运算).当两个数组大小(Numpy.shape)不同时,进行算术运算会出现广播机制. 数组广播数组在进行矢量化运算的时,要求数组形状时相等的.当形状不等的数组执行算术运算的时候,就会出现广播机制,该机制会对数组进行扩展,使数组的shape属性值一样,就可以进行矢量化运算了. import numpy as np arr1 = np.array([[0], [1], [2], [3]]) print(arr1.sha
详解Numpy中的广播原则/机制

广播的原则如果两个数组的后缘维度(从末尾开始算起的维度)的轴长度相符或其中一方的长度为1,则认为它们是广播兼容的.广播会在缺失维度和(或)轴长度为1的维度上进行. 在上面的对arr每一列减去列平均值的例子中,arr的后缘维度为3,arr.mean(0)后缘维度也是3,满足轴长度相符的条件,广播会在缺失维度进行. 这里有点奇怪的是缺失维度不是axis=1,而是axis=0,个人理解是缺失维度指的是两个arr除了轴长度匹配的维度,在上面的例子中,正好是axis=0.这块欢迎指正 arr.mean(
深入解析NumPy中的Broadcasting广播机制

前言在吴恩达老师的深度学习专项课程中,老师有提到NumPy中的广播机制,同时那一周的测验也有涉及到广播机制的题目.那么,到底什么是NumPy中的广播机制? 官方文档接下来到了看官方文档的时间. Array Broadcasting in Numpy 广播机制概述让我们探索numpy中一个更高级的概念,这个概念被称为广播. 广播展现了NumPy在算术运算期间是如何处理具有不同形状的数组的. 受到某些约束,较小的阵列将在较大的阵列上"广播",以使它们具有相同形状. 广播提供了一种数组
Broadcast广播机制在Pytorch Tensor Numpy中的使用详解

目录 1.什么是广播机制 2.广播机制的规则 3.代码举例 4.原地操作 1.什么是广播机制根据线性代数的运算规则我们知道,矩阵运算往往都是在两个矩阵维度相同或者相匹配时才能运算.比如加减法需要两个矩阵的维度相同,乘法需要前一个矩阵的列数与后一个矩阵的行数相等.那么在 numpy.tensor 里也是同样的道理,但是在机器学习的某些算法中会出现两个维度不相同也不匹配的矩阵进行运算,那么这时候就需要用广播机制来解决,通过广播机制,其tensor参数可以自动扩展为相等大小(不需要复制数据).下面我
Angularjs中的事件广播 —全面解析$broadcast,$emit,$on

Angularjs中不同作用域之间可以通过组合使用$broadcast,$emit,$on的事件广播机制来进行通信介绍: $broadcast的作用是将事件从父级作用域传播至子级作用域,包括自己.格式如下:$broadcast(eventName,args) $emit的作用是将事件从子级作用域传播至父级作用域,包括自己,直至根作用域.格式如下:$emit(eventName,args) $on用于在作用域中监控从子级或父级作用域中传播的事件以及相应的数据.格式如下:$on(event,dat
解析PHP中Exception异常机制

异常的基本使用当异常被抛出时,其后的代码不会继续执行,PHP 会尝试查找匹配的 "catch" 代码块. 如果异常没有被捕获,而且又没用使用 set_exception_handler() 作相应的处理的话,那么将发生一个严重的错误(致命错误),并且输出 "Uncaught Exception" (未捕获异常)的错误消息. 让我们尝试抛出一个异常,同时不去捕获它: <?php //create function with an exception funct
Docker中关于Namespace隔离机制全面解析

目录前言 1. Docker基本架构服务端客户端 2. Namespace Namespace介绍 Namespace的类型 Mount namespace UTS namespace IPC namespace PID namespace Network Namespace User namespace 深入理解Namespace Namespace的劣势隔离不彻底有些资源和对象不能被Namespace化安全问题前言 Docker 容器能够在服务器中高效运行,离不开容器底层技术的
Android BroadcastReceiver广播机制概述

Android广播机制概述 Android广播分为两个方面:广播发送者和广播接收者,通常情况下,BroadcastReceiver指的就是广播接收者(广播接收器).广播作为Android组件间的通信方式,可以使用的场景如下: 1.同一app内部的同一组件内的消息通信(单个或多个线程之间): 2.同一app内部的不同组件之间的消息通信(单个进程): 3.同一app具有多个进程的不同组件之间的消息通信: 4.不同app之间的组件之间消息通信: 5.Android系统在特定情况下与App之间的消
python的广播机制详解

目录为什么会有广播机制在矩阵或向量相关运算中的广播机制 1.一般的运算 2.一个矩阵一个向量的情况 3.两个向量 4.矩阵乘法的广播机制总结为什么会有广播机制 python语言在设计的时候,就就考虑到用于两个运算的矩阵或向量维度不匹配的问题.例如,我们有矩阵A,让矩阵每个元素都加1,直接使用A+1,就可以完成目的.这其中就用到了python的广播机制,所以在很多python的第三方库中,都支持广播机制,例如Numpy.pytorch. 在矩阵或向量相关运算中的广播机制 1.一般的运算假
源码解析python中randint函数的效率缺陷

目录一.前言二.对randint()运行效率的测试三.从源码分析randint()的缺陷 random.random() random.randint() 四.更快的生成随机整数的方法 random.random() 直接使用 getrandbits() 使用 Numpy.random 一.前言前几天,在写一个与差分隐私相关的简单程序时,我发现了一些奇怪的东西:相对于其他的随机数生成函数,Python的random.randint()函数感觉很慢. 由于 randint() 是 Pyth
tomcat中Servlet的工作机制详细介绍

tomcat中Servlet的工作机制在研究Servlet在tomcat中的工作机制前必须先看看Servlet规范的一些重要的相关规定,规范提供了一个Servlet接口,接口中包含的重要方法是init.service.destroy等方法,Servlet在初始化时要调用init方法,在销毁时要调用destroy方法,而对客户端请求处理时则调用service方法.对于这些机制的支持都必须由Tomcat内部去支持,具体则是由Wrapper容器提供支持. 在tomcat中消息流的流转机制是通过四个不

深入解析NumPy中的Broadcasting广播机制

前言

官方文档

广播机制概述

广播机制规则

总结

相关推荐

随机推荐