Python2.7下subprocess调用perl脚本增加timeout

Python2.7下subprocess调用perl脚本增加timeout

29 JAN 2016 on Skill

背景

去年(2015年)年底开发了个自动分析崩溃的工具,分两个功能模块。

  1. 解析模块:一个python脚本,获取客户端上传上来的崩溃日志,并在Jenkins上找到对应的版本,下载对应的app文件和dSYM文件,调用Apple提供的symbolicatecrash对崩溃日志中的堆栈地址符号化,找到崩溃的符号存储到本地数据库中。
  2. 展示模块:flask开发的web应用,按照崩溃地址的符号分类展示所有崩溃。

在实际运行中发现一个“找了好多资料”都没解决的问题,symoblicatecrash(这是个perl脚本)在符号化某些日志的时候会“阻塞”(perl进程cpu占用99%)。

一时间找不到直接解决办法,只能采用“躲避”方案。

问题

之前在运行symbolicatecrash命令时,使用 os.system(cmdline) 的方式,此命令会一直阻塞等待 cmdline 命令结束。

于是找 timeout 方法,(以前做Windows开发,一个WaitForSingleObject 就可以等待进程句柄了)找到了subprocess模块,但发现subprocess的方法Popen 在Python2.7下没有 timeout 参数。(Python3.x下有timeout参数)。

搜到一个替代方案,配合threading,


import subprocess, threading

class Command(object):
    def __init__(self, cmd):
        self.cmd = cmd
        self.process = None

    def run(self, timeout):
        def target():
            print 'Thread started'
            self.process = subprocess.Popen(self.cmd, shell=True)
            self.process.communicate()
            print 'Thread finished'

        thread = threading.Thread(target=target)
        thread.start()

        thread.join(timeout)
        if thread.is_alive():
            print 'Terminating process'
            self.process.terminate()
            thread.join()
        print self.process.returncode

command = Command("echo 'Process started'; sleep 2; echo 'Process finished'")
command.run(timeout=3)
command.run(timeout=1)

进程超时解决了,但,symbolicatecrash是个perl脚本,运行后popen返回的是shell执行者 sh 的句柄,而不是 perl 进程的句柄,因此仍然无法强制结束 perl 进程。

这时,找到了 exec 。

通过 exec 可以将popen返回的句柄替换为真实执行的perl进程的句柄。

系统调用exec是以新的进程去代替原来的进程,但进程的PID保持不变。因此,可以这样认为,exec系统调用并没有创建新的进程,只是替换了原来进程上下文的内容。原进程的代码段,数据段,堆栈段被新的进程所代替。 这里使用subprocess调用起perl脚本后,如果不使用exec间接调用,则subprocess拥有的句柄会是shell脚本的执行者sh的句柄,而不是perl的句柄。

因此可以,

command = Command("exec symbolicatecrash ...")
command.run(timeout=15)
posted @   邱明成  阅读(763)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
历史上的今天:
2019-07-04 使用benchmarkSQL测试数据库的TPCC
2017-07-04 Java 泛型 <? super T> 中 super 怎么 理解?与 extends 有何不同?
点击右上角即可分享
微信分享提示