利用Python+Java调用Shell脚本时的死锁陷阱详解

2025-02-04 13:56:26

前言

最近有一项需求，要定时判断任务执行条件是否满足并触发 Spark 任务，平时编写 Spark 任务时都是封装为一个 Jar 包，然后采用 Shell 脚本形式传入所需参数执行，考虑到本次判断条件逻辑复杂，只用 Shell 脚本完成不利于开发测试，所以调研使用了 Python 和 Java 分别调用 Spark 脚本的方法。

使用版本为 Python 3.6.4 及 JDK 8

Python

主要使用 subprocess 库。Python 的 API 变动比较频繁，在 3.5 之后新增了 run 方法，这大大降低了使用难度和遇见 Bug 的概率。

subprocess.run(["ls", "-l"])
subprocess.run(["sh", "/path/to/your/script.sh", "arg1", "arg2"])

为什么说使用 run 方法可以降低遇见 Bug 的概率呢？

在没有 run 方法之前，我们一般调用其他的高级方法，即 Older high-level API，比如 call，check_all，或者直接创建 Popen 对象。因为默认的输出是 console，这时如果对 API 不熟悉或者没有仔细看 doc，想要等待子进程运行完毕并获取输出，使用了 stdout = PIPE 再加上 wait 的话，当输出内容很多时会导致 Buffer 写满，进程就一直等待读取，形成死锁。在一次将 Spark 的 log 输出到 console 时，就遇到了这种奇怪的现象，下边的脚本可以模拟：

# a.sh
for i in {0..9999}; do
 echo '***************************************************'
done

p = subprocess.Popen(['sh', 'a.sh'], stdout=subprocess.PIPE)
p.wait()

而 call 则在方法内部直接调用了 wait 产生相同的效果。

要避免死锁，则必须在 wait 方法调用之前自行处理掉输入输出，或者使用推荐的 communicate 方法。 communicate 方法是在内部生成了读取线程分别读取 stdout stderr，从而避免了 Buffer 写满。而之前提到的新的 run 方法，就是在内部调用了 communicate。

stdout, stderr = process.communicate(input, timeout=timeout)

Java

说完了 Python，Java 就简单多了。

Java 一般使用 Runtime.getRuntime().exec() 或者 ProcessBuilder 调用外部脚本：

Process p = Runtime.getRuntime().exec(new String[]{"ls", "-al"});
Scanner sc = new Scanner(p.getInputStream());
while (sc.hasNextLine()) {
 System.out.println(sc.nextLine());
}
// or
Process p = new ProcessBuilder("sh", "a.sh").start();
p.waitFor(); // dead lock

需要注意的是：这里 stream 的方向是相对于主程序的，所以 getInputStream() 就是子进程的输出，而 getOutputStream() 是子进程的输入。

基于同样的 Buffer 原因，假如调用了 waitFor 方法等待子进程执行完毕而没有及时处理输出的话，就会造成死锁。
由于 Java API 很少变动，所以没有像 Python 那样提供新的 run 方法，但是开源社区也给出了自己的方案，如commonsexec，或 http://www.baeldung.com/run-shell-command-in-java，或 alvin alexander 给出的方案（虽然不完整）。

// commons exec，要想获取输出的话，相比 python 来说要复杂一些
CommandLine commandLine = CommandLine.parse("sh a.sh");

ByteArrayOutputStream out = new ByteArrayOutputStream();
PumpStreamHandler streamHandler = new PumpStreamHandler(out);

Executor executor = new DefaultExecutor();
executor.setStreamHandler(streamHandler);
executor.execute(commandLine);

String output = new String(out.toByteArray());

但其中的思想和 Python 都是统一的，就是在后台开启新线程读取子进程的输出，防止 Buffer 写满。

另一个统一思想的地方就是，都推荐使用数组或 list 将输入的 shell 命令分隔成多段，这样的话就由系统来处理空格等特殊字符问题。

参考：

https://dcreager.net/2009/08/06/subprocess-communicate-drawbacks/ https://alvinalexander.com/java/java-exec-processbuilder-process-1 https://www.javaworld.com/article/2071275/core-java/when-runtime-exec—won-t.html

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对我们的支持。

您可能感兴趣的文章:

python调用shell的方法
举例讲解Linux系统下Python调用系统Shell的方法
Java调用linux shell脚本的方法
Java调用Shell命令的方法
JAVA如何调用Shell脚本

举例讲解Linux系统下Python调用系统Shell的方法

时候难免需要直接调用Shell命令来完成一些比较简单的操作,比如mount一个文件系统之类的.那么我们使用Python如何调用Linux的Shell命令?下面来介绍几种常用的方法: 1. os 模块 1.1. os模块的exec方法族 Python的exec系统方法同Unix的exec系统调用是一致的.这些方法适用于在子进程中调用外部程序的情况,因为外部程序会替换当前进程的代码,不会返回.( 这个看了点 help(os) --> search "exec" 的相关介绍,但是没太
python调用shell的方法

1.1 os.system(command) 在一个子shell中运行command命令,并返回command命令执行完毕后的退出状态.这实际上是使用C标准库函数system()实现的.这个函数在执行command命令时需要重新打开一个终端,并且无法保存command命令的执行结果. 1.2 os.popen(command,mode) 打开一个与command进程之间的管道.这个函数的返回值是一个文件对象,可以读或者写(由mode决定,mode默认是'r').如果mode为'r',可以使用
Java调用Shell命令的方法

本文实例讲述了Java调用Shell命令的方法.分享给大家供大家参考.具体如下: 近日项目中有这样一个需求:系统中的外币资金调度完成以后,要将调度信息生成一个Txt文件,然后将这个Txt文件发送到另外一个系统(Kondor)中.生成文件自然使用OutputStreamWirter了,发送文件有两种方式,一种是用写个一个类似于FTP功能的程序,另外一种就是使用Java来调用Shell,在Shell中完成文件的发送操作.我们选择后一种,即当完成外币资金的调度工作后,用Java的OutputStrea
JAVA如何调用Shell脚本

在实际项目中,Java有时候需要调用C写出来的东西,除了JNI以外,我认为一种比较好的方法是JAVA调用Shell.先把C写出来的make成可执行文件,然后再写一个shell脚本执行该可执行文件,最后是JAVA调用该shell脚本. JAVA调用很简单,例子如下: 首先是shell脚本 #!/bin/sh echo Begin word cluster /home/felven/word2vec/word2vec -train /home/felven/word2vec/resultbig.tx
Java调用linux shell脚本的方法

首先,我们需要增加用户对该脚本的执行权限,即复制代码代码如下: String cmdstring = "chmod a+x test.sh"; Process proc = Runtime.getRuntime().exec(cmdstring); proc.waitFor(); //阻塞,直到上述命令执行完 cmdstring = "bash test.sh"; //这里也可以是ksh等 proc = Runtime.getRuntime().exec
利用Python+Java调用Shell脚本时的死锁陷阱详解

前言最近有一项需求,要定时判断任务执行条件是否满足并触发 Spark 任务,平时编写 Spark 任务时都是封装为一个 Jar 包,然后采用 Shell 脚本形式传入所需参数执行,考虑到本次判断条件逻辑复杂,只用 Shell 脚本完成不利于开发测试,所以调研使用了 Python 和 Java 分别调用 Spark 脚本的方法. 使用版本为 Python 3.6.4 及 JDK 8 Python 主要使用 subprocess 库.Python 的 API 变动比较频繁,在 3.5 之后新增了
隐藏shell脚本内容的工具 shc详解

目录简介安装常用选项编译脚本实例1 实例2 设置过期时间如何引用二进制脚本安全性小结从事 Linux 开发的同学,经常需要编写 shell 脚本,有时脚本中会涉及到一些敏感内容,比如一些 IP 地址,用户名以及密码等,或者脚本中有一些关键的代码, 所有这些内容你都不想别人阅读或者修改,更进一步,你希望对脚本设置过期时间,超过指定时间时间之后,脚本就无法使用在不改变脚本内容.功能以及执行方式的情况下,有没有办法实现上面的需求呢? 答案是:有的, 在Linux下,我们可以使用 s
Linux 在Shell脚本中使用函数实例详解

Linux 在Shell脚本中使用函数实例详解 Shell的函数 Shell程序也支持函数.函数能完成一特定的功能,可以重复调用这个函数. 函数格式如下: 函数名() { 函数体 } 函数调用方式: 函数名参数列表实例:编写一函数add求两个数的和,这两个数用位置参数传入,最后输出结果. root@ubuntu:/home/study# vi test3 #!/bin/bash add(){ a=$1; b=$2; z=`expr $a + $b`; echo "The sum is $z&
利用Python打造一个多人聊天室的示例详解

一.实验名称建立聊天工具二.实验目的掌握Socket编程中流套接字的技术,实现多台电脑之间的聊天. 三.实验内容和要求 vii.掌握利用Socket进行编程的技术 viii.必须掌握多线程技术,保证双方可以同时发送 ix.建立聊天工具 x.可以和多个人同时进行聊天 xi.必须使用图形界面,显示双方的语录四.实验环境 PC多台,操作系统Win7,win10(32位.64位) 具备软件python3.6 . 五.操作方法与实验步骤服务端 1.调入多线程.与scoket包,用于实现多线程连接
利用Python上传日志并监控告警的方法详解

目录 1.准备 2.使用阿里云SDK上传Python日志 3.配置日志告警在我们的日常生活工作中,经常会遇到需要上传日志的场景,比如多台机器运行同一个程序,并且需要记录每台机器程序产生的日志,根据相关关键词告警,或者进行无数据告警,如果自己搭建这套系统需要耗费不少时间,因此如果能使用市面上现成的系统会很方便. 本文将教你如何通过阿里云日志服务搭建一套通过Python上传日志.配置日志告警的监控服务. 1.准备开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文
java调用shell脚本及注意事项说明

目录需求问题介绍 1.通过ProcessBuilder进行调度 2.直接通过系统的Runtime类执行shell 遇到的问题 1.没权限运行 2.调用shell脚本提示:No such file or directory 3.shell脚本输出太大,程序卡死问题下面提供工具类和自己的shell脚本工具类 shell脚本需求 get方法下载远程zip包,然后zip包解压,取出第一级目录再次进行压缩获取新的压缩zip包. 问题如果选择使用java代码的IO流操作,在不确定zip包大小的
利用Python代码实现数据可视化的5种方法详解

前言数据科学家并不逊色于艺术家.他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解.更有趣的是,一旦接触到任何可视化的内容.数据时,人类会有更强烈的知觉.认知和交流. 数据可视化是数据科学家工作中的重要组成部分.在项目的早期阶段,你通常会进行探索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些理解.创建可视化方法确实有助于使事情变得更加清晰易懂,特别是对于大型.高维数据集.在项目结束时,以清晰.简洁和引人注目的方式展现最终结果是非常
Java调用shell脚本解决传参和权限问题的方法

1. java 执行shell java 通过 Runtime.getRuntime().exec() 方法执行 shell 的命令或脚本,exec()方法的参数可以是脚本的路径也可以是直接的 shell命令代码如下(此代码是存在问题的.完整代码请看2): /** * 执行shell * @param execCmd 使用命令或脚本标志位 * @param para 传入参数 */ private static void execShell(boolean execCmd, String
java编译时与运行时概念与实例详解

Java编译时与运行时很重要的概念,但是一直没有明晰,这次专门博客写明白概念. 基础概念编译时编译时顾名思义就是正在编译的时候.那啥叫编译呢?就是编译器帮你把源代码翻译成机器能识别的代码.(当然只是一般意义上这么说,实际上可能只是翻译成某个中间状态的语言.比如Java只有JVM识别的字节码,.另外还有啥链接器.汇编器.为了了便于理解我们可以统称为编译器) 那编译时就是简单的作一些翻译工作,比如检查老兄你有没有粗心写错啥关键字了啊.有啥词法分析,语法分析之类的过程.就像个老师检查学生的作文中有
shell脚本之sed详细用法详解

目录 sed的作用 sed使用方法介绍命令行格式举例说明对文件进行增.删.改.查操作增加文件内容对文件进行搜索替换操作其他命令其他选项 sed结合正则使用补充扩展总结总结 sed的作用 sed是Stream Editor(流编辑器)的缩写,简称流编辑器:用来处理文件的 sed是一行一行读取文件内容并按照要求进行处理,把处理后的结果输出到屏幕首先sed读取文件中的一行内容,把其保存在一个临时缓存区中(也称为模式空间) 然后根据需求处理临时缓冲区中的行,完成后把该行发送到屏幕上

利用Python+Java调用Shell脚本时的死锁陷阱详解

您可能感兴趣的文章:

相关推荐

随机推荐