Fork me on GitHub

Python 之 模块

1. 模块

1.1 概念

  • 每一个以扩展名 .py 结尾的 Python 源代码文件都是一个模块;
  • 模块名同样也是一个标识符,需要符合标识符的命名规则;
  • 在模块中定义的全局变量, 函数, 类都是提供给外界直接使用的工具;

1.2 模块的两种导入方式

  • import 导入
  • from...import 导入
# 示例: import 导入
import 模块名1
import 模块名2


# 备注: 如果模块的名字太长,可以使用as指定模块的名称,以方便在代码中的使用
import 模块名1 as 模块别名(模块别名应该符合大驼峰命名法)


# 示例二: from ... import
# 如果希望从某一个模块中,导入部分工具,就可以使用 from ... import 的方式
from 模块名1 import 工具名

# 导入之后,不需要通过 模块名.
# 可以直接使用模块提供的工具(即全局变量,函数, 类)
# 如果两个模块,存在同名的函数,那么后导入模块的函数,会覆盖掉先导入的函数;

1.3 import的搜索路径

# import 搜索路径
# ipython3 中输入
import sys
sys.path # 查看 import 依次查找要导入的模块文件的路径

# 添加自定义路径
sys.path.append('/Documents/python/xxxx')
sys.path.insert(0, '/Documents/python/xxx')  # 可以确保先搜索这个路径


# 重新导入模块
from imp import *
reload(需要重新导入的模块)

1.4 循环导入

# 示例
# a.py
from b import b

print('===========this is module a.py============')


def a():
    print("hello, a")
    b()

a()


# b.py
from a import a

print('===========this is module b.py============')
def b():
    print("hello, b")

def c():
    a()
c()

1.5 开发原则

  • __name__属性:测试模块的代码只在测试情况下被运行,而在被导入时,不会被执行!
  • __name__记录着一个字符串:
    • 被导入到其他文件内部后, __name__就是当前模块名;
    • 在当前执行的程序内部, __name____main__;
# 示例: 代码格式
# 1. 导入模块
# 2. 定义全局变量
# 3. 定义类
# 4. 定义函数
# 5. 测试代码

# 在代码的最下方
def main():
    # 编写测试代码
    pass

# 根据 __name__ 的值,判断是否执行下方代码
if __name__ = "__main__":
    main()

1.6 包(Package)

  • 包就是一个包含多个模块的特殊目录;
  • 目录下,有一个特殊的文件 __init__.py;
  • 包的命名方式和变量名一致;
  • 使用 import 包名 可以一次性导入包中所有的模块,也就是先执行__init__.py文件的内容;
  • __init__.py中需要指定对外界提供的模块列表;
# 示例:
# 从 当前目录 导入 模块列表
from . import 模块1
from . import 模块2

1.7 发布模块

# 具体步骤(三步):
# 1) 创建 setup.py
from distutils.core import setup

setup(name="xxx_message", # 包名
      version="1.0", # 版本
      description="消息模块", # 描述信息
      long_description="详细的描述信息", # 完整描述信息
      author="noodles", # 作者
      author_email="isliuxian@163.com", # 作者邮箱
      url="www.google.com", # 主页
      py_modulse=["模块1",
                  "模块2"])

# 2) 构建模块
$ python3 setup.py build

# 3) 生成发布压缩包
$ python3 setup.py sdist

1.8 安装模块

  • 模块(包).__file__: 可以查看模块(包)的完整路径;
# 安装模块
$ tar -zxvf 模块压缩包
$ sudo python3 setup.py install

# 卸载模块,直接从安装目录下删除
$ cd /usr/local/lib/python3.5/dist-packages/
$ sudo rm -r 包名

1.9 pip 安装第三方模块

  • pip是一个现代的,通用的 Python 包管理工具;
  • 提供了对 Python 包的查找,下载,安装和卸载等功能;
# 将 pygame 模块安装到 python2.x 环境
$ sudo pip install pygame
$ sudo pip uninstall pygame

# 将 pygame 模块安装到 Python 3.x 环境
$ sudo pip3 install pygame
$ sudo pip3 uninstall pygame

# mac 下安装 iPython
$ sudo pip install ipython   # 针对 python2.x
$ sudo pip3 install ipython  # 针对 python3.x

2. 文件操作

2.1 操作文件的函数/方法

  • open函数,负责打开文件,并且返回文件操作对象;
  • read方法,将文件内容读取到内存;
  • write方法,将指定内容写入文件;
  • close方法,关闭文件;
  • 以上三个方法均需要通过文件对象来调用;

2.2 read方法--读取文件

  • open函数的第一个参数就是要打开的文件名(文件名区分大小写)
    • 如果文件存在,返回文件操作对象;
    • 如果文件不存在,会抛出异常;
  • read方法可以一次性读入并返回文件的所有内容;
  • close方法负责关闭文件;
  • 如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问;
# 示例:
# 打开
file = open("a.txt")

# 读取
text = file.read()
print(text)

# 关闭
file.close()

2.3 文件指针

  • 文件指针标记从哪个位置开始读取数据;
  • 第一次打开文件时,通常文件指针会指向文件的开始位置;
  • 当执行了 read 方法后,文件指针会移动到读取内容的末尾;

2.4 打开文件的方式

  • open函数默认以只读方式打开文件,并且返回文件对象
f = open("文件名", "访问方式")

# 访问方式说明:
# r: 以只读方式打开文件;文件的指针将会放在文件的开头,这是默认模式;
# w: 以只写方式打开文件,如果文件存在会被覆盖;如果文件不存在,创建新文件;
# a: 以追加方式打开文件,如果该文件已经存在,文件指针将会放在文件的末尾; 如果文件不存在,创建新的文件进行写入;
# r+: 以读写方式打开文件;文件的指针将会放在文件的开头;如果文件不存在,抛出异常;
# w+: 以读写方式打开文件;如果文件存在会被覆盖;如果文件不存在,创建新文件;
# a+: 以读写方式打开文件;如果该文件已经存在,文件指针将会放在文件的末尾; 如果文件不存在,创建新的文件进行写入;

# 备注:频繁的移动文件指针,会影响文件的读写效率;开发中,更多的时候会以只读,只写的方式来操作文件;
# a(append)

2.5 按行读取文件内容

  • readline方法可以一次读取一行内容;
  • 方法执行后,会把文件指针移动到下一行,准备再次读取;
  • read方法默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重;
# 打开文件
file = open("a.txt")

while True:
    # 读取一行内容
    text = file.readline()

    # 判断是否读到内容
    if not text:
        break

    # 没读取一行的末尾已经有一个 '\n'
    print(text, end="")

# 关闭文件
file.close()


# 示例: 文件复制
# 1. 打开文件
file_read = open("a.txt")
file_write = open("b.txt", "w")

# 2. 读 写
while True:
    # 读取到一行内容
    text = file_read.readline()

    # 判断是否读取到内容
    if not text:
        break

    file_write.write(text)

# 3. 关闭
file_read.close()
file_write.close()

3. 常用模块及其方法

  • help(模块名): 可以查看模块的具体功能;

3.1 time 模块

  • time(): 获取当前时间,毫秒数;
  • clock(): 计算CPU执行的时间;
  • localtime(): 获取本地时间;
  • strftime('%Y--%m--%d %H:%M:%S', time.localtime()): 将时间格式化为字符串;
  • striptime('2018--03--16 10:03:36', %Y--%m--%d %H:%M:%S): 将字符串时间转换成元组的形式;
  • ctime(毫秒数):将毫秒值转换成具体的时间格式;
  • mktime(具体日期): 将具体日期转换成毫秒值;

3.2 datetime 模块

  • datetime.datetime.now():获取当前时间;

3.3 random 模块

  • random(): 获取 0~1 的随机数;
  • randint(1, 6): 获取 1~6 的随机数(包括6);
  • randrange(1, 5): 取 1~5 的随机数(不包括5);
  • choice('this is a beatiful day'): 从字符串中随机取一个值;
  • choice(['234', '57', 5, [4, 6]]): 从列表中随机取一个值;
  • sample(['234', '57', 5, [4, 6]], 2): 从列表中随机取两个值;

3.4 os 模块

  • os模块在与操作系统进行交互;
  • os.getcwd(): 获取当前工作目录, 即当前python脚本工作的目录路径;
  • os.chdir('dirname'): 改变当前脚本工作目录, 相当于 shell 下 cd;
  • os.curdir(): 返回当前目录(current dir);
  • os.pardir(): 获取当前目录的父目录字符串名(parent dir);
  • os.makedirs('dir2/dir3'): 可生成多层递归目录;
  • os.removedirs('dir1'): 删除多级空目录;
  • os.mkdir(目录名): 创建目录;
  • os.rmdir(目录名): 删除单级空目录;
  • os.listdir(目录名): 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式返回;
  • os.remove(文件名): 删除一个文件;
  • os.rename(源文件名, 目标文件名): 重命名;
  • os.stat('path/filename'): 获取文件/目录信息;
  • os.sep: 输出操作系统特定的路径分隔符, win下为 \\, Linux 为 /;
  • os.linesep: 输出当前平台使用的行终止符; win下为 \t\n, Linux 为 \n;
  • os.pathsep: 输出用于分割文件路径的字符串;
  • os.name: 输出字符串,指示当前使用的平台, win -> nt, Linux -> posix;
  • os.system('bash command'): 运行shell命令,直接显示;
  • os.environ: 获取系统环境变量;
  • os.path.abspath(path): 返回规范化的绝对路径;
  • os.path.split(path): 将 path 分割成目录和文件名的元组形式返回;
  • os.path.dirname(path): 返回 path 的目录, 其实就是 os.path.split(path)的第一个元素;
  • os.path.basename(path): 返回 path 最后的文件名; 若path以/\结尾,那么就会返回空值;
  • os.path.exists(path): 如果path存在,返回True; 如果不存在,返回 False;
  • os.path.isdir(文件路径): 判断是否是文件;
  • os.path.join([path2, path3]):将多个路径组合后,返回;
  • os.path.getatime(path): 返回path所指向的文件或者目录的最后存取时间;
  • os.path.getmtime(path): 返回path所指向的文件或者目录的最后修改时间;

3.5 sys 模块

  • sys模块在与Python解释器进行交互;
  • sys.argv: 命令行参数List, 第一个元素是程序本身路径;
  • sys.exit(n): 退出程序, 正常退出:exit(0);
  • sys.version: 获取Python解释程序的版本信息;
  • sys.maxint: 最大的Int值;
  • sys.path: 返回模块的搜索路径,初始化时,使用PYTHONPATH环境变量的值;
  • sys.platform: 返回操作系统平台名称;
  • sys.stdout.write('please: ')
  • val = sys.stdin.readline()[:-1]

3.6 hashlib 模块

# 示例:
import hashlib

m = hashlib.md5()
print(m)    # 输出: <md5 HASH object @ 0x105772120>

# 'hello world' 是以 unicode 保存的, 需要编码为 utf8
m.update('hello world'.encode('utf8'))

print(m.hexdigest())      # 输出: 5eb63bbbe01eeed093cb22bb8f5acdc3

# 备注: hex, 表示十六进制;

s = hashlib.sha256()
s.update('hello world'.encode('utf8'))
print(s.hexdigest())

3.7 logging 模块

  • logging模块提供了标准的日志接口,可以存储各种格式的日志;
  • logging日志可以分为: debug(),info(),warning(),error()critical()
# 示例一:
import logging

# 日志配置
logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                    datefmt='%a, %d %b %Y %H:%M:%S',
                    filename='/tmp/test.log',
                    filemode='w')


logging.debug('debug message')
logging.info('info message')
logging.warning('hello error')
logging.error('error message')
logging.critical('critical message')


# 示例二:
# logging.getLogger([name])(返回一个logger对象, 如果没有指定名字,将返回root logger)
import logging

logger = logging.getLogger()
# 创建一个handler, 用于写入日志文件
fh = logging.FileHandler('test.log')

# 再创建一个handler, 用于输出到控制台
ch = logging.StreamHandler()

formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')


fh.setFormatter(formatter)
ch.setFormatter(formatter)

logger.addHandler(fh)
logger.addHandler(ch)

logger.setLevel(logging.DEBUG)  # 设置日志级别

logger.debug('logger debug message')
logger.info('logger info message')
logger.warning('logger warning message')
logger.error('logger error message')
logger.critical('logger critical message')

3.8 ConfigParser 模块

  • 用于生成和修改常见配置文档,Python 3.x 变更为 configparser
# 示例一:
# 常见文档格式:
ServerAliveInterval = 45
Compression = yes
CompressionLevel = 9
ForwardX11 = yes


[bitbucket.org]
User = hg

[topsecret.server.com]
Port = 50022
ForwardX11 = no

# 使用 Python 生成上面的文档
import configparser

config = configparser.ConfigParser()
config['DEFAULT'] = {'ServerAliveInterval': '45',
                      'Compression': 'yes',
                      'CompressionLevel': '9'}

config['bitbucket.org'] = {}
config['bitbucket.org']['User'] = 'hg'
config['topsecret.server.com'] = {}
topsecret = config['topsecret.server.com']
topsecret['Host Port'] = '50022'
topsecret['ForwardX11'] = 'no'
config['DEFAULT']['ForwardX11'] = 'yes'


# 写入配置文件
with open('example.ini', 'w') as configfile:
    config.write(configfile)


# 示例二: 读取配置文件内容
import configparser
config = configparser.ConfigParser()


# 读取配置文件
config.read('example.ini')
print(config.sections())    # 输出: ['bitbucket.org', 'topsecret.server.com']
print(config.defaults())    # 输出: OrderedDict([()'compression', 'yes'), ])

# 判断
'bitbucket.org' in config   # 输出: True

# 获取某一个值
config['bitbucket.org']['User']     # 输出: 'hg'

# 删除某一个值
config.remove_section('topsecret.server.com')

config.write(open('example.ini', 'w'))

# 修改某一个值
config.set('bitbucket.org', 'user', 'alex')
config.write(open('example.ini', 'w'))

3.9 re 模块(正则表达式模块)

  • 正则表达式是一种小型的,高度专业化的编程语言,在Python中,通过re模块实现。
  • re.findall(匹配规则, 需要匹配的字符串, flags): 所有的结果都返回到一个列表里;
  • re.search(匹配规则, 需要匹配的字符串, flags): 返回返回匹配到的第一个对象(object),对象可以调用group()来返回结果;
  • re.match(): 只从字符串的第一个字符开始匹配,返回匹配到的第一个对象(object);
  • re.split(): 分割;
  • re.sub():替换;
  • re.compile()

4. eval()函数

  • eval()函数,可以将字符串当成有效的表达式来求值,并返回计算结果
  • eval("1 + 1"), 输出结果: 2
# 示例: 计算器

# 提示用户输入一个加减乘除混合运算表达式
input_str = input("请输入一个算术题: ")

print(eval(input_str))

# 备注: 开发时,千万不要使用 eval() 函数,直接转换 input 的结果
# 原因:类似于"注入攻击"

# 当用户输入: __import__('os').system('ls')
# 等价于:
import os
os.system("终端命令")

posted @ 2018-03-08 23:53  小a的软件思考  阅读(249)  评论(0编辑  收藏  举报