第十章模块与包( 读取位于包中的数据文件)

读取位于包中的数据文件

问题

       你的包中包含代码需要去读取的数据文件。你需要尽可能地用最便捷的方式来做这件事。

解决方案

       假设你的包中的文件组织成如下:

mypackage/
    __init__.py
    somedata.dat
    spam.py

  现在假设 spam.py 文件需要读取 somedata.dat 文件中的内容。你可以用以下代码来完成:

#spam.py
import pkgutil

data_bytes = pkgutil.get_data('mypackage', 'somedata.dat')
data_str = data_bytes.decode()
print(data_str)

  由此产生的变量是包含该文件的原始内容的字节字符串。

讨论
       要读取数据文件,你可能会倾向于编写使用内置的 I/ O 功能的代码,如 open()。但是这种方法也有一些问题。
       首先,一个包对解释器的当前工作目录几乎没有控制权。因此,编程时任何 I/O 操作都必须使用绝对文件名。由于每个模块包含有完整路径的 __file__ 变量,这弄清楚它的路径不是不可能,但它很凌乱。
       第二,包通常安装作为.zip 或.egg 文件,这些文件并不像在文件系统上的一个普通目录里那样被保存。因此,你试图用 open() 对一个包含数据文件的归档文件进行操作,它根本不会工作。
       pkgutil.get_data() 函数是一个读取数据文件的高级工具,不用管包是如何安装以及安装在哪。它只是工作并将文件内容以字节字符串返回给你。
       get_data() 的第一个参数是包含包名的字符串。你可以直接使用包名,也可以使用特殊的变量,比如 __package__。

posted @ 2021-01-26 14:58  wangshanglinju  阅读(47)  评论(0编辑  收藏  举报