解决Tensorflow sess.run导致的内存溢出问题

2025-02-16 00:22:08

下面是调用模型进行批量测试的代码(出现溢出)，开始以为导致溢出的原因是数据读入方式问题引起的，用了tf , PIL和cv等方式读入图片数据，发现越来越慢，内存占用飙升，调试时发现是sess.run这里出了问题（随着for循环进行速度越来越慢）。

  # Creates graph from saved GraphDef
  create_graph(pb_path)

  # Init tf Session
  config = tf.ConfigProto()
  config.gpu_options.allow_growth = True
  sess = tf.Session(config=config)
  init = tf.global_variables_initializer()
  sess.run(init)

  input_image_tensor = sess.graph.get_tensor_by_name("create_inputs/batch:0")
  output_tensor_name = sess.graph.get_tensor_by_name("conv6/out_1:0") 

  for filename in os.listdir(image_dir):
    image_path = os.path.join(image_dir, filename)

    start = time.time()
    image_data = cv2.imread(image_path)
    image_data = cv2.resize(image_data, (w, h))
    image_data_1 = image_data - IMG_MEAN
    input_image = np.expand_dims(image_data_1, 0)

    raw_output_up = tf.image.resize_bilinear(output_tensor_name, size=[h, w], align_corners=True)
    raw_output_up = tf.argmax(raw_output_up, axis=3)

    predict_img = sess.run(raw_output_up, feed_dict={input_image_tensor: input_image})    # 1，height，width
    predict_img = np.squeeze(predict_img)   # height， width 

    voc_palette = visual.make_palette(3)
    masked_im = visual.vis_seg(image_data, predict_img, voc_palette)
    cv2.imwrite("%s_pred.png" % (save_dir + filename.split(".")[0]), masked_im)

    print(time.time() - start)

  print(">>>>>>Done")

下面是解决溢出问题的代码（将部分代码放在for循环外）

  # Creates graph from saved GraphDef
  create_graph(pb_path)

  # Init tf Session
  config = tf.ConfigProto()
  config.gpu_options.allow_growth = True
  sess = tf.Session(config=config)
  init = tf.global_variables_initializer()
  sess.run(init)

  input_image_tensor = sess.graph.get_tensor_by_name("create_inputs/batch:0")
  output_tensor_name = sess.graph.get_tensor_by_name("conv6/out_1:0") 

##############################################################################################################
  raw_output_up = tf.image.resize_bilinear(output_tensor_name, size=[h, w], align_corners=True)
  raw_output_up = tf.argmax(raw_output_up, axis=3)
##############################################################################################################

  for filename in os.listdir(image_dir):
    image_path = os.path.join(image_dir, filename)

    start = time.time()
    image_data = cv2.imread(image_path)
    image_data = cv2.resize(image_data, (w, h))
    image_data_1 = image_data - IMG_MEAN
    input_image = np.expand_dims(image_data_1, 0)

    predict_img = sess.run(raw_output_up, feed_dict={input_image_tensor: input_image})    # 1，height，width
    predict_img = np.squeeze(predict_img)   # height， width 

    voc_palette = visual.make_palette(3)
    masked_im = visual.vis_seg(image_data, predict_img, voc_palette)
    cv2.imwrite("%s_pred.png" % (save_dir + filename.split(".")[0]), masked_im)
    print(time.time() - start)

  print(">>>>>>Done")

总结：

在迭代过程中, 在sess.run的for循环中不要加入tensorflow一些op操作，会增加图节点，否则随着迭代的进行，tf的图会越来越大，最终导致溢出；

建议不要使用tf.gfile.FastGFile(image_path, 'rb').read()读入数据（有可能会造成溢出），用opencv之类读取。

以上这篇解决Tensoflow sess.run导致的内存溢出问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

解决Tensorflow 内存泄露问题

使用tensorflow进行编程时,经常遇到操作不当,带来的内存泄露问题,这里有一个可以帮助debug问题所在方法: https://stackoverflow.com/questions/51175837/tensorflow-runs-out-of-memory-while-computing-how-to-find-memory-leaks/51183870#51183870 使用tf.Graph.finalize()把运算图变成只读的,从而对图的修改都会报错,从而找到内存泄露的定点. 目
TensorFlow内存管理bfc算法实例

1. 基本介绍 tensorflow设备内存管理模块实现了一个best-fit with coalescing算法(后文简称bfc算法). bfc算法是Doung Lea's malloc(dlmalloc)的一个非常简单的版本. 它具有内存分配.释放.碎片管理等基本功能. 2. bfc基本算法思想 1. 数据结构整个内存空间由一个按基址升序排列的Chunk双向链表来表示,它们的直接前趋和后继必须在地址连续的内存空间.Chunk结构体里含有实际大小.请求大小.是否被占用.基址.直接前趋.直接后
Tensorflow 训练自己的数据集将数据直接导入到内存

制作自己的训练集下图是我们数据的存放格式,在data目录下有验证集与测试集分别对应iris_test, iris_train 为了向伟大的MNIST致敬,我们采用的数据名称格式和MNIST类似 classification_index.jpg 图像的index都是5的整数倍是因为我们选择测试集的原则是每5个样本,选择一个样本作为测试集,其余的作为训练集和验证集生成这样数据的过程相对简单,如果有需要python代码的,可以给我发邮件,或者在我的github下载至此,我们的训练集,测试集,验证
Tensorflow 实现释放内存

我在做tensorflow开发的时候遇到如下的错误,我请教了深度学习社区q群中的大神,大神说这是运算图还在内存中,没有及时释放,需要restart一下kernel,但是由于我的代码不能停止执行,所以没办法用重新运行代码来解决释放内存运行图的问题. 问题: with tf.Session() as sess: saver = tf.train.Saver() #保存运算图当我退出with并且立马执行 self.sess = tf.Session() self.saver = tf.train.i
浅谈tensorflow之内存暴涨问题

在用tensorflow实现一些模型的时候,有时候我们在运行程序的时候,会发现程序占用的内存在不断增长.最后内存溢出,程序被kill掉了. 这个问题,其实有两个可能性.一个是比较常见,同时也是很难发现的.这个问题的解决,需要我们知道tensorflow在构图的时候,是没有所谓的临时变量的,只要有operator.那么tensorflow就会在构建的图中增加这个operator所代表的节点.所以,在运行程序的过程中,内存不断增长的原因就是在模型训练迭代的过程中,tensorflow一直在帮你增加图
解决tensorflow训练时内存持续增加并占满的问题

记录一次小白的tensorflow学习过程,也为有同样困扰的小白留下点经验. 先说我出错和解决的过程.在做风格迁移实验时,使用预加载权重的VGG19网络正向提取中间层结果,结果因为代码不当,在遍历图片提取时内存持续增长,导致提取几十个图片的特征内存就满了. 原因是在对每一张图片正向传播结束后,都会在留下中间信息.具体地说是在我将正向传播的代码与模型的代码分离了,在每次遍历图片时都会正向传播,在tensorflow中新增加了很多的计算节点(如tf.matmul等等),导致内存中遗留了大量的过期信息
tensorflow 打印内存中的变量方法

法一: 循环打印模板 for (x, y) in zip(tf.global_variables(), sess.run(tf.global_variables())): print '\n', x, y 实例 # coding=utf-8 import tensorflow as tf def func(in_put, layer_name, is_training=True): with tf.variable_scope(layer_name, reuse=tf.AUTO_REUSE):
解决TensorFlow训练内存不断增长,进程被杀死问题

TensorFlow训练时,遇到内存不断增长,最终导致内存不足,进程被杀死. 在这里我不准备对造成这一现象的所有原因进行探讨,只是记录一下我在项目中遇到的这一问题,下面将对我遇到的内存不断增长的原因进行分析. 在TensorFlow中构造图,是将一些op作为节点加入图中,在run之前,是需要构造好一个图的,所以在run的时候,如果run图中不存在的节点,TensorFlow就会将节点加入图中,随着不断的迭代,造成内存不断的增长,从而导致内存不足. 下面举一个很容易发现这个问题的例子: impor
解决Tensorflow sess.run导致的内存溢出问题

下面是调用模型进行批量测试的代码(出现溢出),开始以为导致溢出的原因是数据读入方式问题引起的,用了tf , PIL和cv等方式读入图片数据,发现越来越慢,内存占用飙升,调试时发现是sess.run这里出了问题(随着for循环进行速度越来越慢). # Creates graph from saved GraphDef create_graph(pb_path) # Init tf Session config = tf.ConfigProto() config.gpu_options.allow_
完美解决因数据库一次查询数据量过大导致的内存溢出问题

刚开始接触项目的实习生,积累经验,欢迎交流之前做项目,遇到过一次查询数据量过大而导致的内存溢出问题,找了很多办法一直未能实际解决问题, 今天又遇到了,经过前辈的指导,终于解决了问题!! 不过此方法只在DBug启动下有效以上这篇完美解决因数据库一次查询数据量过大导致的内存溢出问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
jquery不会自动回收xmlHttpRequest对象导致了内存溢出

之前一直都不曾注意到这一点,今天幸亏看了kuibono的文章,下面是kuibono给出的手动回收xmlHttpRequest对象的代码片断: 每次jquery的Ajax请求都会创建一个xmlHttprequest对象,理论上讲,长连接的请求是一个无限递归,请求数量是非常大的,但是由于每次请求都会建立一个新的xmlhttprequest,而且jquery不会自动回收资源,所以导致了内存溢出. 通过查看jquery API,发现jquery还有一个 complete对象,是请求完成后回调函数 (请求
解决vue自定义指令导致的内存泄漏问题

vue的自定义指令是一个比较容易引起内存泄漏的地方,原因就在于指令通常给元素绑定了事件,但是如果忘记了解绑,就会产生内存泄漏的问题. 看下面代码: directives: { scroll: { inserted (el, cb) { // 不是元素节点 || 未设置回调函数 if (el.nodeType !== 1 || !cb) return let direct = 'down' let rollHeight = 0 let getScrollEventTarget = (target)
vue项目内存溢出问题及解决方案

目录 vue项目内存溢出的解决 vue项目内存溢出问题问题解决方法1 解决方法2 总结 vue项目内存溢出的解决最近在对原有项目进行迭代升级,有用代码越来越多,导致内存溢出了. 正常启动运行还是可以的,但是只要对代码进行简单修改,在热更新的时候项目就会直接崩掉.这就导致了10分支的开发差不多有7分钟的时间在重启项目,严重影响开发效率,让人上火. 刚好同事之前也遇到过,特点问了一下解决方式. 说下解决 npm install -g increase-memory-limit npx cro
angular 内存溢出的问题解决

本项目用的是angular4搭建,用动态组件的形式来显示页面,之前遇到过因为内存溢出而导致无法aot的问题, 解决方法:手动改写内存上限修改目录: my-project/node_modules/.bin 找到 ng.cmd : @IF EXIST "%~dp0\node.exe" ( "%~dp0\node.exe" --max_old_space_size=8192 "%~dp0\..\@angular\cli\bin\ng" %* )
使用jQuery Ajax功能时需要注意的一个问题(内存溢出)

最近一哥们在做一个Ajax长连接的项目,页面需要和服务器保持长连接,而且在连接超时后需要重新请求连接,过程中他问我要用到什么,我也是想都没想就告诉他用jQuery.jQuery不是有ajaxSuccess ajaxError这些对象吗,在请求完成或者请求失败后重新请求不就好了. 但是后来他告诉我说没有用 jQuery,自己手工写的XMLhttprequest .他告诉我说,开始是用jquery写的,而且在测试过程中也没有出现问题.但是在后来无意中发现,在页面开的时候久了之后,浏览器资源竟然占用非
完美解决TensorFlow和Keras大数据量内存溢出的问题

内存溢出问题是参加kaggle比赛或者做大数据量实验的第一个拦路虎. 以前做的练手小项目导致新手产生一个惯性思维--读取训练集图片的时候把所有图读到内存中,然后分批训练. 其实这是有问题的,很容易导致OOM.现在内存一般16G,而训练集图片通常是上万张,而且RGB图,还很大,VGG16的图片一般是224x224x3,上万张图片,16G内存根本不够用.这时候又会想起--设置batch,但是那个batch的输入参数却又是图片,它只是把传进去的图片分批送到显卡,而我OOM的地方恰是那个"传进去&quo

解决Tensorflow sess.run导致的内存溢出问题

相关推荐

随机推荐