浅谈tensorflow 中的图片读取和裁剪方式

2025-04-07 07:42:11

一方式1: skimage

from skimage import data, io, transform, color
import matplotlib.pyplot as plt 

# io.imread 读出的图片格式是uint8，value是numpy array 类型。
image = data.coffee()
image = io.imread(dir)

plt.imshow(image)
plt.show()

io.save('1.jpg',image) #保存图像

image_gray = color.rgb2gray(image) #转换为灰度图像
io.save('2.jpg',image_gray)

# 通过transform.resize()裁剪后的图片是以 float64的格式存储的，数值的取值范围是（0~1）
image_ = transform.resize(image,(200,200))
img = image_ * 255 #将图片的取值范围改成（0~255）
img = img.astype(np.uint8)
img = image_ * 255 #将图片的取值范围改成（0~255）
img = img.astype(np.uint8)

二、方式2：cv2

import cv2
import matplotlib.pyplot as plt 

# cv2.imread读出的图片格式是uint8,value也是numpy array 类型。
# 图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。
image=cv2.imread(dir)
b,g,r = cv2.split(image)  #将图像通道分离开
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
plt.imshow(rgb_image) 

# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的， 数值的取值范围是（0~255）
image_cv2 = cv2.resize(rgb_image)

image=cv2.imread(dir)
b,g,r = cv2.split(image)  #将图像通道分离开
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合
#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
plt.imshow(rgb_image) 

# 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的， 数值的取值范围是（0~255）
image_cv2 = cv2.resize(rgb_image)

补充知识：tensorflow中两种读图及裁剪图片的区别（io.imread和cv2.imread）以及（transform.resize和cv2.resize）

Tensorflow中，在训练图片数据之前，需要先对图片进行预处理，读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式，这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是，图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时，需要将图片通道改成RGB，具体代码如下。

import cv2
import matplotlib.pyplot as plt
from skimage import transform
import numpy as np
import skimage.io as io 

train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'

'''以cv2方式读取图片'''
image=cv2.imread(train_dir)
b,g,r = cv2.split(image)  #将图像通道分离开
rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合

#image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式
plt.imshow(rgb_image)

'''以io.imread方式读取图片'''
#image = io.imread(train_dir) #读图并显示
#plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的，数值的取值范围是（0~1）。通常在制作tfrecord 数据集的过程中，我们需要将其转换成numpy array的形式，具体代码如下

'''以io.imread方式读取图片并使用transform形式裁剪图片'''
image = io.imread(train_dir) #读图并显示
plt.imshow(image)
image =transform.resize(image, (208, 208))
img = image * 255 #将图片的取值范围改成（0~255）
img = img.astype(np.uint8) 

plt.imshow(img)

读图和裁剪图片在制作tfrecord数据集时，是很基础的步骤，在接下来，我还将进一步更新如何制作自己的tfrecord数据集，以及tfrecord的读取。如有谬误，还请大家斧正。

以上这篇浅谈tensorflow 中的图片读取和裁剪方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

python使用TensorFlow进行图像处理的方法

一.图片的放大缩小在使用TensorFlow进行图片的放大缩小时,有三种方式: 1.tf.image.resize_nearest_neighbor():临界点插值 2.tf.image.resize_bilinear():双线性插值 3.tf.image.resize_bicubic():双立方插值算法下面是示例代码: # encoding:utf-8 # 使用TensorFlow进行图片的放缩 import tensorflow as tf import cv2 import numpy
tensorflow之读取jpg图像长和宽实例

有时需要读取jpg图像的长和宽,tensorflow提供了很好的支持直接上示例 decode_jpeg_data = tf.placeholder(dtype=tf.string) decode_jpeg = tf.image.decode_jpeg(decode_jpeg_data, channels=3) image_data = tf.gfile.FastGFile("C:/Users/shenwei/Desktop/timg.jpg", 'rb').read() print(
tensorflow如何批量读取图片

本文实例为大家分享了tensorflow如何批量读取图片的具体代码,供大家参考,具体内容如下代码: import tensorflow as tf import os def picread(filelist): """ 读取狗的图片并转换成张量 :param filelist: 文件路f径+名字的列表 :return: 每张图片的张量 """ # 1.构造文件的队列 file_queue = tf.train.string_input_pro
初探TensorFLow从文件读取图片的四种方式

本文记录一下TensorFLow的几种图片读取方法,官方文档有较为全面的介绍. 1.使用gfile读图片,decode输出是Tensor,eval后是ndarray import matplotlib.pyplot as plt import tensorflow as tf import numpy as np print(tf.__version__) image_raw = tf.gfile.FastGFile('test/a.jpg','rb').read() #bytes img =
浅谈tensorflow 中的图片读取和裁剪方式

一方式1: skimage from skimage import data, io, transform, color import matplotlib.pyplot as plt # io.imread 读出的图片格式是uint8,value是numpy array 类型. image = data.coffee() image = io.imread(dir) plt.imshow(image) plt.show() io.save('1.jpg',image) #保存图像 image
浅谈tensorflow中Dataset图片的批量读取及维度的操作详解

三维的读取图片(w, h, c): import tensorflow as tf import glob import os def _parse_function(filename): # print(filename) image_string = tf.read_file(filename) image_decoded = tf.image.decode_image(image_string) # (375, 500, 3) image_resized = tf.image.resize
浅谈TensorFlow中读取图像数据的三种方式

本文面对三种常常遇到的情况,总结三种读取数据的方式,分别用于处理单张图片.大量图片,和TFRecorder读取方式.并且还补充了功能相近的tf函数. 1.处理单张图片我们训练完模型之后,常常要用图片测试,有的时候,我们并不需要对很多图像做测试,可能就是几张甚至一张.这种情况下没有必要用队列机制. import tensorflow as tf import matplotlib.pyplot as plt def read_image(file_name): img = tf.read_fil
浅谈java 中文件的读取File、以及相对路径的问题

一.对于java项目中文件的读取 1.使用System 或是系统的Properties对象 ①直接是使用 String relativelyPath=System.getProperty("user.dir"); ②使用Properties对象我们先来遍历一下系统的属性: Properties properties = System.getProperties(); Enumeration pnames = properties.propertyNames(); while (pn
浅谈tensorflow中几个随机函数的用法

如下所示: tf.constant(value, dtype=None, shape=None) 创建一个常量tensor,按照给出value来赋值,可以用shape来指定其形状.value可以是一个数,也可以是一个list. 如果是一个数,那么这个常亮中所有值的按该数来赋值. tf.random_normal(shape,mean=0.0,stddev=1.0,dtype=tf.float32) tf.truncated_normal(shape, mean=0.0, stddev=1.0,
浅谈tensorflow中张量的提取值和赋值

tf.gather和gather_nd从params中收集数值,tf.scatter_nd 和 tf.scatter_nd_update用updates更新某一张量.严格上说,tf.gather_nd和tf.scatter_nd_update互为逆操作. 已知数值的位置,从张量中提取数值:tf.gather, tf.gather_nd tf.gather indices每个元素(标量)是params某个axis的索引,tf.gather_nd 中indices最后一个阶对应于索引值. tf.ga
浅谈tensorflow 中tf.concat()的使用

concat()是将tensor沿着指定维度连接起来.其中tensorflow1.3版中是这样定义的: concat(values,axis,name='concat') 一.对于2维来说,0表示行,1表示列 t1 = [[1, 2, 3], [4, 5, 6]] t2 = [[7, 8, 9], [10, 11, 12]] with tf.Session() as sess: print(sess.run(tf.concat([t1, t2], 0) )) 结果为:[[1, 2, 3], [4
浅谈tensorflow中dataset.shuffle和dataset.batch dataset.repeat注意点

batch很好理解,就是batch size.注意在一个epoch中最后一个batch大小可能小于等于batch size dataset.repeat就是俗称epoch,但在tf中与dataset.shuffle的使用顺序可能会导致个epoch的混合 dataset.shuffle就是说维持一个buffer size 大小的 shuffle buffer,图中所需的每个样本从shuffle buffer中获取,取得一个样本后,就从源数据集中加入一个样本到shuffle buffer中. imp
浅谈JS中的三种字符串连接方式及其性能比较

工作中经常会碰到要把2个或多个字符串连接成一个字符串的问题,在JS中处理这类问题一般有三种方法,这里将它们一一列出顺便也对它们的性能做个具体的比较. 第一种方法用连接符"+"把要连接的字符串连起来: str="a"; str+="b"; 毫无疑问,这种方法是最便捷快速的,如果只连接100个以下的字符串建议用这种方法最方便. 第二种方法以数组作为中介用 join 连接字符串: var arr=new Array(); arr.push(a);
浅谈java中String的两种赋值方式的区别

类似普通对象,通过new创建字符串对象.String str = new String("Hello"); 内存图如下图所示,系统会先创建一个匿名对象"Hello"存入堆内存(我们暂且叫它A),然后new关键字会在堆内存中又开辟一块新的空间,然后把"Hello"存进去,并且把地址返回给栈内存中的str, 此时A对象成为了一个垃圾对象,因为它没有被任何栈中的变量指向,会被GC自动回收. 直接赋值.如String str = "Hello&

浅谈tensorflow 中的图片读取和裁剪方式

相关推荐

随机推荐