python内存泄漏

python基本运行机制。Python程序运行时不需要编译成二进制代码，而直接从源码运行程序，简单来说是，Python解释器将源码转换为字节码，然后再由解释器来执行这些字节码。

解释器的具体工作：

1 完成模块的加载和链接；

2 将源代码编译为PyCodeObject对象(即字节码)，写入内存中，供CPU读取；

3 从内存中读取并执行，结束后将PyCodeObject写回硬盘当中，也就是复制到.pyc或.pyo文件中，以保存当前目录下所有脚本的字节码文件；

* 之后若再次执行该脚本，它先检查【本地是否有上述字节码文件】和【该字节码文件的修改时间是否与其脚本一致】。是就直接执行，否则重复上述步骤。

如果你的程序是死循环，不停歇的代码，下列是需要注意内存的问题。
第一、pillow库的隐患

#内存将发生泄漏
from PIL import  Image

im = Image.open('1.jpg')
im.save()

#使用with使程序更安全
from PIL import  Image

with open('1.jpg' , 'rb') as open_file:
    im = Image.open(open_file)

第二、使用importlib.reload重载模块后带来使用全局变量带来的隐患
假如采取不重启程序方式，自动重新载入修改后的文件，所以需要进行重载模块

#run.py
import importlib

while True:
    module_name = importlib.import_module('.', 'test_file')
    module_name = importlib.reload(module_name)
    result = module_name.main(params)

#test_file.py
global_value = {'dataList':[],
                'number':'',}
key = '初始值'

def main(params):

    # params携带着此次任务数据

    global_value['number'] = params['number']
    get_data1(params)
    get_data2(params)
    return global_value

def get_data1(params):
    global key
    # 你的程序通过params得到新的数据
    data_once = {'每次运行产生的键': '每次运行产生的键值'}
    key = '新值'
    global_value['dataList'].append(data_once)

def get_data2(params):
    # 你的程序通过params和key新的值，得到另一份数据
    data_once = {'每次运行产生的新键': '每次运行产生的新键值'}
    global_value['dataList'].append(data_once)

上述就会发生一种隐患，以前我觉得垃圾回收机制很靠谱。但是当每一次重载模块时，global_value将使用新的地址，原来的地址还放着上一次的数据，没有被释放掉
就算你在每次循环里添加gc.collect()也不能快速回收删除上一次的数据，导致内存持续增长。。。

我的处理方式是
（1）将global_value这个转移进函数内，通过传参将get_data1和get_data2数据整合在一个变量里
（2）将所有函数放在一个类中，也可以避免全局变量数据存活时间太长

总结，虽然使用全局变量很省事，不用传参，其他函数改变其值再被其他函数调用很方便，却会导致内存泄漏，因为每一次reload时产生的是新的内存地址。

posted @ 2019-09-13 14:37 spotfg 阅读(1382) 评论(0) 编辑收藏举报

刷新页面返回顶部

spotfg

python内存泄漏

公告