浅谈TensorFlow之稀疏张量表示

2025-10-24 06:21:16

对于多维的稀疏数据，TensorFlow 支持 SparseTensor 表示。

官方文档地址：https://tensorflow.google.cn/api_guides/python/sparse_ops

构造稀疏张量

SparseTensor(indices, values, dense_shape)

indices是一个维度为(n, ndims)的2-D int64张量，指定非零元素的位置。比如indices=[[1,3], [2,4]]表示[1,3]和[2,4]位置的元素为非零元素。n表示非零元素的个数，ndims表示构造的稀疏张量的维数。

values是一个维度为(N)的1-D张量，对应indices所指位置的元素值。

dense_shape是一个维度为(ndims)的1-D张量，代表稀疏张量的维度。

tf.SparseTensor(indices=[[0, 0], [1, 2]], values=[1, 2], dense_shape=[3, 4])
>>
[[1, 0, 0, 0]
 [0, 0, 2, 0]
 [0, 0, 0, 0]]

转换

将稀疏张量转为普通矩阵。

tf.sparse_to_dense(
sparse_indices,
output_shape,
sparse_values,
default_value=0,
validate_indices=True,
name=None
)

sparse_indices是那些非零元素的位置。

sparse_indices是实数，该矩阵为一维矩阵，指定一维矩阵的某一个元素位置

sparse_indices是向量，该矩阵为一维矩阵，指定一维矩阵的多个元素

sparse_indices是二维矩阵，该矩阵为多维矩阵，指定多维矩阵的多个元素。

output_shape是矩阵的维度。

sparse_value是对应sparse_indices所指位置的元素值。

default_value是未指定元素的默认值，一般为0。

import tensorflow as tf 

mysparse_indices = tf.constant(5)
mymatrix = tf.sparse_to_dense(mysparse_indices, [11], 10)
with tf.Session() as sess:
  result = sess.run(mymatrix)
  print(result)

//[0 0 0 0 0 10 0 0 0 0 0]

SparseTensor和SparseTensorValue

两者的参数相同。

在计算图中定义稀疏张量时，使用SparseTensor；在feed数据时使用SparseTensorValue。

补充知识：彻底搞懂tensorflow里的张量(tensor)

1.引言

学习卷积神经网络(CNN)的时候，最重要的就是搞清楚网络各层的神经元输入输出的数据结构(即张量)。如果仅用线性代数所学的矩阵，向量来理解张量，一定会搞得一头雾水。因此很有必要搞清楚张量是什么东西。

首先明确：张量最主要的两个参数： rank（阶，或维数）、shape（形状）

2.什么是张量

下图是张量的直观的示意：张量是标量、向量、矩阵的集合和推广。

3.什么是rank

rank	数学实例	Python 例子
0	纯数字（只有大小）	s=352
1	向量（1个基本向量）	v = [1.1, 2.2, 3.3]
2	矩阵(两个基本向量)	m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
3	数据立体（3个基本向量）	t = [ [[2], [4], [6]] , [[8], [10], [12]] , [[14], [16], [18]] ]
n	n个基本向量	…

可以发现：可以数括号[ ]的层数来确定张量的维数(阶)

什么是基本向量

基本向量(basis vector)：几个basis vector就是从几个方面来描述一组数据。

举例说明：

一维张量：概念和向量完全一样。图中的白线就是一个向量，当然了，在三维空间向量有三个分向量（分别是x方向、y方向、z方向）

二维张量：对下面这个长方形施加一个力，怎么来描述？

我们把可以把这个长方形就xoy、xoz、yoz三个平面截下来，之后在每一个平面上再分析受力情况。

两个basis vector出来了：一个用来描述截面方向（这是一个三维向量）；另一个用来描述此截面的受力情况（当然这也是一个三维向量）

那么我们可以用作用在yoz平面（此平面的法向量是x轴单位向量），受力的x轴分量用Pxx来表示，以此推广到含有9个元素的矩阵，这就是一个2维张量。

换句话来解释：在一个三维空间，我们从2个基本向量来描述一个东西，那么这个张量所含有的元素个数应该是3的2次方等于9个。每个元素能得到2个基本向量的注释。这就是一个2维的张量

三维张量：

继续推广，每个元素有三个基本向量注释。三维的张量形状就像是叠起来的矩阵。

最后品一品这句话

4.什么是shape

shape指明每一层有多少个元素。

比如[2,3,4]是指第一层2个元素，第二层3个元素，第三层4个元素，通过这个我们就可以知道这个张量一共有2 × 3 × 4=24 个元素。而且它有3层，因此可以知道这个张量的rank=3

注意：读取元素，从外括号往内括号读

下面这个代码也能说明问题。

import tensorflow as tf
# 定义了一个张量，有6个元素，设置他的形状是[2.3]
a = tf.constant([1, 2, 3, 4, 5, 6], shape=[2,3])
with tf.Session() as session:
  print(session.run(a))

打印的结果是

[[1 2 3] [4 5 6]]

以上这篇浅谈TensorFlow之稀疏张量表示就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

tensorflow多维张量计算实例

两个三维矩阵的乘法怎样计算呢?我通过实验发现,tensorflow把前面的维度当成是batch,对最后两维进行普通的矩阵乘法.也就是说,最后两维之前的维度,都需要相同. 首先计算shape为(2, 2, 3)乘以shape为(2, 3, 2)的张量. import tensorflow as tf import numpy as np a = tf.constant(np.arange(1, 13, dtype=np.float32), shape=[2, 2, 3]) b = tf.const
浅谈tensorflow中张量的提取值和赋值

tf.gather和gather_nd从params中收集数值,tf.scatter_nd 和 tf.scatter_nd_update用updates更新某一张量.严格上说,tf.gather_nd和tf.scatter_nd_update互为逆操作. 已知数值的位置,从张量中提取数值:tf.gather, tf.gather_nd tf.gather indices每个元素(标量)是params某个axis的索引,tf.gather_nd 中indices最后一个阶对应于索引值. tf.ga
TensorFlow获取加载模型中的全部张量名称代码

核心代码如下: [tensor.name for tensor in tf.get_default_graph().as_graph_def().node] 实例代码:(加载了Inceptino_v3的模型,并获取该模型所有节点的名称) # -*- coding: utf-8 -*- import tensorflow as tf import os model_dir = 'C:/Inception_v3' model_name = 'output_graph.pb' # 读取并创建一个图gr
浅谈TensorFlow之稀疏张量表示

对于多维的稀疏数据,TensorFlow 支持 SparseTensor 表示. 官方文档地址:https://tensorflow.google.cn/api_guides/python/sparse_ops 构造稀疏张量 SparseTensor(indices, values, dense_shape) indices是一个维度为(n, ndims)的2-D int64张量,指定非零元素的位置.比如indices=[[1,3], [2,4]]表示[1,3]和[2,4]位置的元素为非零元素.
浅谈tensorflow中几个随机函数的用法

如下所示: tf.constant(value, dtype=None, shape=None) 创建一个常量tensor,按照给出value来赋值,可以用shape来指定其形状.value可以是一个数,也可以是一个list. 如果是一个数,那么这个常亮中所有值的按该数来赋值. tf.random_normal(shape,mean=0.0,stddev=1.0,dtype=tf.float32) tf.truncated_normal(shape, mean=0.0, stddev=1.0,
浅谈Tensorflow由于版本问题出现的几种错误及解决方法

1.AttributeError: 'module' object has no attribute 'rnn_cell' S:将tf.nn.rnn_cell替换为tf.contrib.rnn 2.TypeError: Expected int32, got list containing Tensors of type '_Message' instead. S:由于tf.concat的问题,将tf.concat(1, [conv1, conv2]) 的格式替换为tf.concat( [con
浅谈tensorflow中Dataset图片的批量读取及维度的操作详解

三维的读取图片(w, h, c): import tensorflow as tf import glob import os def _parse_function(filename): # print(filename) image_string = tf.read_file(filename) image_decoded = tf.image.decode_image(image_string) # (375, 500, 3) image_resized = tf.image.resize
浅谈Tensorflow 动态双向RNN的输出问题

tf.nn.bidirectional_dynamic_rnn() 函数: def bidirectional_dynamic_rnn( cell_fw, # 前向RNN cell_bw, # 后向RNN inputs, # 输入 sequence_length=None,# 输入序列的实际长度(可选,默认为输入序列的最大长度) initial_state_fw=None, # 前向的初始化状态(可选) initial_state_bw=None, # 后向的初始化状态(可选) dtype=No
浅谈tensorflow之内存暴涨问题

在用tensorflow实现一些模型的时候,有时候我们在运行程序的时候,会发现程序占用的内存在不断增长.最后内存溢出,程序被kill掉了. 这个问题,其实有两个可能性.一个是比较常见,同时也是很难发现的.这个问题的解决,需要我们知道tensorflow在构图的时候,是没有所谓的临时变量的,只要有operator.那么tensorflow就会在构建的图中增加这个operator所代表的节点.所以,在运行程序的过程中,内存不断增长的原因就是在模型训练迭代的过程中,tensorflow一直在帮你增加图
浅谈tensorflow 中tf.concat()的使用

concat()是将tensor沿着指定维度连接起来.其中tensorflow1.3版中是这样定义的: concat(values,axis,name='concat') 一.对于2维来说,0表示行,1表示列 t1 = [[1, 2, 3], [4, 5, 6]] t2 = [[7, 8, 9], [10, 11, 12]] with tf.Session() as sess: print(sess.run(tf.concat([t1, t2], 0) )) 结果为:[[1, 2, 3], [4
浅谈Tensorflow加载Vgg预训练模型的几个注意事项

写这个博客的关键Bug: Value passed to parameter 'input' has DataType uint8 not in list of allowed values: float16, bfloat16, float32, float64.本博客将围绕加载图片和保存图片到本地来详细解释和解决上述的Bug及其引出来的一系列Bug. 加载图片首先,造成上述Bug的代码如下所示 image_path = "data/test.jpg" # 本地的测试图片
浅谈tensorflow模型保存为pb的各种姿势

一,直接保存pb 1, 首先我们当然可以直接在tensorflow训练中直接保存为pb为格式,保存pb的好处就是使用场景是实现创建模型与使用模型的解耦,使得创建模型与使用模型的解耦,使得前向推导inference代码统一.另外的好处就是保存为pb的时候,模型的变量会变成固定的,导致模型的大小会大大减小. 这里稍稍解释下pb:是MetaGraph的protocol buffer格式的文件,MetaGraph包括计算图,数据流,以及相关的变量和输入输出主要使用tf.SavedModelBuilde

浅谈TensorFlow之稀疏张量表示

相关推荐

随机推荐