python模块与包的导入

模块：

　　一个模块就是一个包含了python定义和声明的文件，文件名就是模块名字加上.py的后缀（模块名不能定义成中文）

为何要使用模块：

　　因为退出python解释器然后在进入python解释器，那么你之前定义的函数或者变量都将丢失，因此我们通常都将程序写到文件中便永久保存下来，需要时就通过python *.py方式去运行，此时的*.py被称为脚本script。

　　站在开发效率来讲，随着程序的发展，功能越来越多，为了方便管理，我们通常将程序分成一个个的文件，这样做程序的结构更清晰，方便管理。这是我们不仅仅可以把这些文件当做脚本去执行，还可以把他们当做模块来导入到其他模块中，实现了功能的重复利用

那么如何使用模块呢？

import

#test.py
print('from the test.py')
money=1000
def read1():
    print('spam->read1->money',1000)
def read2():
    print('spam->read2 calling read')
    read1()
def change():
    global money
    money=0

test.py(module)

import test         #导入模块，导入就是在执行导入的文件
                     #导入模块后，就是通过import定义一个模块名，并且这个模块下的所以名字都因此在test名字的后面
print(test.money)   #这样才能取到test模块下面的各种变量

use_test.py(use module)

请看下图

要想取出test下的money变量的值，需要通过test这个'门牌号'来取就是print(test.money)

如果在当前文件中又定义了一个新的money变量。再次执行print(test.money)的结果还是原来的值。因为即使当前目录下定义了相同的变量，但是它们的内存地址并不一样。不管怎么写，只要是通过模块名去调用模块下面的代码，那么执行的结果一定是原来的东西

导入模块最倡导的方式就是'模块名.调用名'

import test             #import只会在第一次导入时才会执行，后面的导入都是在引用之前创建好的名字。不会再把文件内容执行
import test
import test
import test             #即使导入多次也是执行一次效果
#import过程就是要执行文件里面的代码，是文件就要有路径，所以import是一个找文件的过程。为什么能在当前目录下导入直接导入模块，因为调用与被调用模块都在同一个目录下，所以直接就能找到，调用。并且impor导入多次t不能每次都找，那样速度会慢。

我们可以使用sys.module找到当前已经加载的模块，sys.module是一个字典，内部包含模块名与模块对象的映射，该字典决定了导入模块时是否需要重新导入

import test as te
print(te.money) #为模块起别名 ，适用于那种模块名很长，或者以冲突的模块名
#起别名还有一个好处就是扩展性强
#比如说两个模块都可以处理相同的问题 那么可以把这两个定义成一个别名，在调用的时候会很方便
if file_format == 'xml':
    import xmlreader as reader
elif file_format == 'csv':
    import csvreader as reader
data=reader.read_date('filename')

import os,sys,time,test     #一行导入多个模块

from ... import ...

相对于import test来说，它会将源文件的名称空间'test'带入到当前名称空间中，使用时必须是test.名字的方式，而from语句相当于import，也会创建新的名称空间，但是将test中的名字直接导入到当前名称空间中，在当前名称空间中，使用名字可以直接调用

from test import read1,read2            #注意 调用名字标红并不是报错，只是系统不识别自己定义的模块
read1()
read2()

PS：但是如果当前导入的模块里有跟当前名称空间相冲突的名字，那么下面的名字就会覆盖上面

这种方法就是不需要进行test.最为前缀去调用，但是它的执行仍然跟test.执行一样，仍然要回到之前的名称空间中去运行

强烈不建议用from ... import 方法

也可以支持起别名

也支持多行导入

from test import * #导入所有，不推荐
#但是在某些情况下还得使用，各自体会吧

如果我在模块中，将一个名字以下划线(_)开头，那么import将无法导入

#但是可以通过用下面方法还是可以执行的
from test import _money

__all__

__all__=['money','read1']

#如果使用了__all__参数那么后面要跟一个列表，然后里面以字符串的方式写入，代表着如果里面写入了一些名字，那么谁在通过import test from *调用，只会调用__all__里面的名字，read2将不会调用

将模块当做脚运行

在模块中，最下方输入print(__name__),然后倒入模块后，会执行模块的内容，并且输入模块名，这个模块名就是print(__name__)执行的

但是模块只能被导入么？答案是否定的，模块也能单独当一个脚本执行。如果单独执行那么print(__name__)的输出就是__main__

所以通过__name__可以标识一种状态，文件此刻被已一种什么样的方式去使用。如果是__main__那么就当做脚本去执行，如果是文件名本身那么就是被调用。

通过 if __name__ =='__main__' 来控制文件在不同的场景下有不同执行效果。

模块搜索路径

导入模块：首先会从内存中找內建模块；如果不存在，然后会去系统的环境变量里找；如果不在当前目录，那么需要将要导入模块的路径添加到sys.path中，使用sys.path.append('路径')；

在Python中导入代码会在Python中__pycache__目录下产生一个文件如(test.cpython-33.pyc)这个里面的test就是被导入的模块，而这个文件就是为了提高模块的导入速度。

导入包

包：就是一个目录，在Python中，一个文件夹中有__init__.py的文件

无论是import形式还是from...import形式，凡是在导入语句中（而不是在使用时）遇到带点的，都要第一时间提高警觉：这是关于包才有的导入语法

包A与包B下有相同的模块也不会冲突，如A.a与B.a这是来自两个命名空间

包结构

glance/                   #Top-level package

├── __init__.py      #Initialize the glance package

├── api                  #Subpackage for api

│   ├── __init__.py

│   ├── policy.py

│   └── versions.py

├── cmd                #Subpackage for cmd

│   ├── __init__.py

│   └── manage.py

└── db                  #Subpackage for db

    ├── __init__.py

    └── models.py

文件中代码

#文件内容

#policy.py
def get():
    print('from policy.py')

#versions.py
def create_resource(conf):
    print('from version.py: ',conf)

#manage.py
def main():
    print('from manage.py')

#models.py
def register_models(engine):
    print('from models.py: ',engine)

注意事项

1.关于包相关的导入语句也分为import和from...import...两种，但是无论哪种，无论什么位置，在导入时都必须遵循一个原则：凡事在导入时带点的，点的左边必须是一个包，否则非法。可以带有一连串的点，如item.subitem,subsubitem.但是都必须遵循这个原则

2.对于导入后，在使用时就没有这种限制了，点的左边可以是包，模块，函数类（他们都可以用点的方式调用自己的属性）

3.对比import item 和from item import name的应用场景：

　　如果我们想直接使用name，那么必须使用后者

import sys
import glance.api.policy as g1
print(sys.path)
g1.get()

from...import...

需要注意的是from...import导入的模块，import后面必须是导一个具体的目标，错误语法（from a import b.c）正确语法(from a.b.c import d)

import后面不需要写点，后面不需要再进行找包的过程，找包的过程都是在from a.b.c 来完成的

from glance.api.policy import get
get()

#或者
from glance.api import policy
policy.get()

导入包时做了什么事？

导入文件的时候，会执行文件，那么导入包呢？在每个包中都会有一个__init__文件，那么在导入的时候会首先执行init文件，然后会在当前位置产生一个名字，这个名字来引用一个名称空间。

#如果直接导入glance包并且调用glance.api.policy下面的get方法需要怎么做？
import glance
glance.get()

如果如上述方法肯定会报错。因为你已经知道导入包就是执行包下面的__init__文件，那么可以用glacne下__init__文件来导入glance下的包，在通过其他文件来导入glance这个大包。

#在__init__中导入这个policy包，
from glance.api.policy import get
#然后再导入文件中导入glance包。
import glance
glance.get()
#那么只要一调用glance包就会执行__init__，而__init__就会执行from glance.api.policy import get 得到get功能。那么就可以直接用glance.get调用了

注意，在__init__中导入的包不是随便写的，导包就是一个找包的过程，还记得之前说的找包首先按照内存找，然后在sys.path中找，最后如果找不到需要将路径添加到sys.path中，所有在__init__中导入包要有一个参照物，那么这个参照物就sys.path中的路径。

因为上面的glance包与导入包文件都是在同级目录，如果在不同级目录的话，比如（a/glance）那么在导入就会报错，因为在内存中和sys.path中并没有这个路径，所以需要将a这个路径添加到sys.path中

import sys
sys.path.append(r'C:\Users\Administrator\PycharmProjects\untitled\模块\a')
import glance

这样在导入就可以了

绝对导入与相对导入

在开发一个包的时候不需要考虑别人如何调用

绝对导入：

特别需要注意的是：可以用import导入内置或者第三方模块，但是要绝对避免使用import来导入自定义包的子模块，应该使用from... import ...的绝对或者相对导入,且包的相对导入只能用from的形式。

导入系统模块

hashlib模块

hashlib提供了常见的摘要算法如，MD5,SHA1等

这里先阐述一个加密与摘要的区别：
首先MD5并不是一个加密算法，而是一个摘要算法。加密算法是双向的，能加密，必然能通过加密后的值进行逆推。而摘要算法属于单向的，通过算法得出的值无法进行逆推。摘要算法又称为哈希算法，散列算法。它通过一个函数，把任意长度的数据转换成定长的数据串

摘要算法的作用在于防篡改。
例如，网上有一篇博客，内如是（hello world，jack），并且它的摘要算法值是"291250459873666ed73be15305ac5c17" 如果在下载的时候有人将博客的内容篡改了，那么再次校验的值是与之前的值是不同的

hashlib提供的函数还是比较简单的
导入hashlib模块

import hashlib
obj=hashlib.md5()
#创建一个对象

#对字符进行加密操作
    
obj.update('hello'.encode('utf-8'))

#执行后没有任何输出

#查看摘要值，这个结果是一个32位的二进制值
print(obj.hexdigest())

#16进制值
print(obj.digest())

如果一个字符串很长的话可以进行拆分加密加密后的结果与之前是一样的

import hashlib

obj=hashlib.md5()
# obj.update("hello".encode("utf-8"))
# obj.update("world".encode("utf-8"))
# fc5e038d38a57032085441e7fe7010b0
# b'\xfc^\x03\x8d8\xa5p2\x08TA\xe7\xfep\x10\xb0'
obj.update("helloworld".encode("utf-8"))
print(obj.hexdigest())
print(obj.digest())

除了md5还有其他的算法如,SHA算法

SHA算法里面包含了很多算法，常见的如SHA1,SHA256,SHA512

像md5,SHA1,SHA256,SHA512它们之间算法的加密等级是不一样的，越复杂的算法效率等级越慢。这个主要还是看需求来定。目前用的比较多的是SHA256

注意用法与md5一样

import hashlib

sha1= hashlib.sha1()    #hashlib.sha256() hashlib.sha512()
sha1.update('hello'.encode('utf-8'))
print(sha1.hexdigest())

摘要算法的应用：
主要用于登录注册是进行加密。数据库中像这样的表，肯定是不可能明文进行存储。都是进行加密后的。

比如这样的
username | password
---------+---------------------------------
jack     | e10adc3949ba59abbe56e057f20f883e
lily     | 878ef96e86145580c38c87f0410ad153
tom      | 99b1c2188db85afee403b1536010c2c9

但是会有这么一种人，他在注册的时候设置的密码过于简单比如’123456‘，’admin‘等等。这样就容易让他人撞库。那么如何预防这种事情发生呢？

我们可以在服务器端进行'加盐'操作

import hashlib

obj=hashlib.md5("salt".encode('utf-8'))
obj.update("hello".encode("utf-8"))
obj.update("world".encode("utf-8"))

# fc5e038d38a57032085441e7fe7010b0
# b'\xfc^\x03\x8d8\xa5p2\x08TA\xe7\xfep\x10\xb0'
print(obj.hexdigest())
print(obj.digest())

#这样在输出的结果就与之前的结果不同了

logging模块

　　在没有使用这个模块之前，我们想要将日志按照不同等级输入到文件中，通过文件操作with open 也可以，但是这样一来会很麻烦。来回的打开关闭文件。接下来学的这个模块就会大大的方便我们对日志的操作

首先导入这个名叫logging的模块
import logging

大家都知道日志中有不同的等级，比如debug info error等。所以在这个模块中也有不同的6种等级

logging.debug("debug")
logging.info("debug")
logging.warning("debug")
logging.error("debug")
logging.caitical("debug")

#执行，查看结果

ERROR:root:debug
CRITICAL:root:debug
WARNING:root:debug

只输出了三行，在logging模块中，默认的输出等级是warning，只有等于或高于warning才会输出。他们之间的等级关系是CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET

有的人可能会说，这样的输出格式看着不太习惯或者明显，可否自己定义格式。没问题，可以通过一个函数来设定，"basicConfig"

logging.basicConfig(level=logging.DEBUG,
                    format="%(asctime)s %(lineno)d %(message)s",
                    datefmt='%a, %d %b %Y %H:%M:%S',
                    filename='test.log',
                    filemode='w')


logging.debug("debug")
logging.info("debug")
logging.error("debug")
logging.critical("debug")
logging.warning("debug")

首先咱们来看，level是设定输出等级，默认是warning，我们修改为debug。
format参数就是修改打印样式，后面的格式都是固定的，通过的是%()s或者%()d来设定。

format参数中可能用到的格式化串：
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名，可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间，用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的，自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

前面的asctime输出的时间精确到毫秒，看着很麻烦，所以我们可以通过datefmt关键字来进行时间格式化操作

filename是文件存放路径。

filemode对文件的操作。默认是是追加的形式，因为日志么，都是通过append的格式写入进文件，如果不想写入也可以通过filemode=w 关键字进行覆盖更改

上面的输出可以满足了我们一般的需求了，但是我要想一边在屏幕输出，一边保存到文件中，怎么做呢。基于上面的basicConfig只能二选一。所以出现了下面这个函数

logger对象

import logging
首先定义一个logger对象
logger = logging.getLogger()

定义两个输出终端

fh = logging.FileHandler('test.log')
# 创建一个handler，用于写入日志文件，给一个路径
ch = logging.StreamHandler()
# 再创建一个handler，用于输出到控制台，不需要路径
#叫什么都无所谓


#流文件，是要输出到终端，还是要输出到文件中，只要将上面的ch或者fh添加到括号里就可以
logger.addHandler(ch)
logger.addHandler(fh)

两种模式全部输出。这样就可以输出，但是并没有样式。
logger.debug("debug")
logger.warning("debug")
logger.info("debug")
logger.error("debug")
logger.critical("debug")

格式化输出，设定日志等级

import logging
logger = logging.getLogger()
fh = logging.FileHandler('test.log')
ch = logging.StreamHandler()
设置formatter对象
formatter=logging.Formatter("%(asctiem)s---%(lineno)d---%(message)s")
formatter2=logging.Formatter("%(asctiem)s---%(message)s")

将设置后的样式添加进去
fh.setFormatter(formtter)
ch.setFormatter(formtter2)

logger.addHandler(ch)
logger.addHandler(fh)

现在的输出就是具有格式的输出。
最后设定输出等级

调整logger
logger.setLevel('DEBUG')

logger.debug("debug")
logger.warning("debug")
logger.info("debug")
logger.error("debug")
logger.critical("debug")

上面的过程用一个图来表示就是这样

re模块

re或正则表达式是一种小型的，高度专业化的编程语言

相对于正则来说，它实现的功能非常明确，就是对于在字符串的模糊匹配。首先它操作的对象一定是字符串

例：
"hello world"
如何将hello world字符串中的world字符替换成jack。通过我们之前学过的字符串操作可以用replace
"hello world".replace("world","jack")

但是可以发现我们替换的都是已知的字符串。如果我想替换以w开头以d结尾的字符呢？这种模糊替换怎么办。就需要用到我们的re模块了

re模块里面的方法不是特别多，非常简单

re.findall("","")
#第一个引号里面写规则(匹配规则),第二个引号里面写要匹配的内容

#模糊匹配
>>> import re
>>> re.findall("world","hello world")
['world']
>>> re.findall("w.*d","hello world")
['world']
>>>

元字符:. ^ $ * + ? { } [ ] | ( ) \

  　'.':匹配任意一个值(换行符无法匹配\n)
    '^':匹配以什么开头
    '$':匹配以什么结尾
    '*':匹配任意多个字符(0到无穷)
    
    >>> re.findall("a\d*b","hello ab")
    ['ab']
    >>> re.findall("a\d*b","hello a123456b")
    ['a123456b']
    
    '+':匹配任意多个字符(1到无穷)
    
    >>> re.findall("a\d+b","hello ab")
    []
    >>> re.findall("a\d+b","hello a123456b")
    ['a123456b']
    
    
    '?':匹配0到1个字符
    
    >>> re.findall("a\d?b","hello a1b")
    ['a1b']
    >>> re.findall("a\d?b","hello ab")
    ['ab']
    
    '{}':
    
    >>> re.findall("\d{4}","hello ab1234")
    ['1234']
    >>> re.findall("\d{4,}","hello ab1234")
    ['1234']
    >>> re.findall("\d{4,}","hello ab1231231232313")
    ['1231231232313']
    >>> re.findall("\d{1,4}","hel3lo a12.5b1231231232313")
    ['3', '12', '5', '1231', '2312', '3231', '3']
    >>> re.findall("\d{1,}","hel3lo a12.5b1231231232313")
    ['3', '12', '5', '1231231232313']
    
    '[]':字符集，在中括号中的任何元字符都失去其意义(^,\,-除外)
    
    >>> re.findall("a[bc]d","abdsdjfjacd")
    ['abd', 'acd']
    
    >>> re.findall("a[b*]","abba*")
    ['ab', 'a*']
    
    >>> re.findall("[0-9]","abba1234567")
    ['1', '2', '3', '4', '5', '6', '7']
    >>> re.findall("[0-9]*","abba1234567")
    ['', '', '', '', '1234567', '']
    >>> re.findall("[0-9]+","abba1234567")
    ['1234567']
    
    >>> re.findall("[^0-9]+","abba1234567")
    ['abba']
    
    >>> re.findall("[\d]+","ab123ba1234567")
    ['123', '1234567']
    
    '|': 或者意思
    >>> re.findall("www.(?:baidu|google).com","www.baidu.com")
    ['www.baidu.com']
    
    
    '()'：分组
    
    >>> re.findall(r"(?:a\d)+","fsda1a2a3a6")
    ['a1a2a3a6']
    #这个分组的包含了一个优先级的问题。findall会先找分组里面的字符串然后进行匹配。匹配成功了。则返回分组里面的匹配值。所以要想输出匹配的字符串要加上'?:'来取消优先级

转移反斜杠

    '\':将有意义的特殊字符转义成无意义。将无意义字符转换成有意义

    >>> re.findall("[\w]+","ab123ba1234567")
    ['ab123ba1234567']
    >>> re.findall("[\d]+","ab123ba1234567")
    ['123', '1234567']
    >>> re.findall(".","ab123ba1234567")
    ['a', 'b', '1', '2', '3', 'b', 'a', '1', '2', '3', '4', '5', '6', '7']

    >>> re.findall("I\b","I am FINE")
    []
    >>> re.findall(r"I\b","I am FINE")
    ['I']

    为什么加上r就可以了呢？请看下面的例子
    >>> re.findall("c\d","abc\d")
    []
    >>> re.findall("c\\d","abc\d")
    []
    >>> re.findall("c\\\\d","abc\d")
    ['c\\d']
    >>> re.findall(r"c\\d","abc\d")
    ['c\\d']

    #从上面的例子中也可看出如果要匹配带有\的字符，如果只输入一个\\转义符那么输出并没有结果。只有输出4个转义符或者在前面加一个r。
    #因为加两个\\是只满足了re模块的需求。但是我们是在python解释器中执行，所以如果要在python解释器中执行，那么就要在加两个。但是为什么要再加两个转义符？因为在python中'\'也是有特殊意义的。所以也要将它进行转义。
    #加r后为什么两个\\反斜杠就可以呢？因为这个r称为原生字符串。目的告诉python解释器，这两个字符串是原生的。没有任何意义

search方法

#这个方法只会匹配第一个值。而且得到的结果不会直接输入到列表中。而是得到一个对象通过group()来读出结果
    >>> re.search("\d+","he123llo a123456b")
    <_sre.SRE_Match object; span=(2, 5), match='123'>
    >>> re.search("\d+","he123llo a123456b").group()
    '123'

match方法

#跟search方法一样，都是拿到一个结果。与search不一样的是必须在字符串开头位置进行匹配
    >>> re.match(r"\d","fsdf123ab456")
    >>> re.match(r"\d","34fsdf123ab456")
    <_sre.SRE_Match object; span=(0, 1), match='3'>
    >>> re.match(r"\d+","34fsdf123ab456")
    <_sre.SRE_Match object; span=(0, 2), match='34'>
    #match只找第一个。找不到就返回空

常见转义符

\d  匹配任何十进制数；它相当于类 [0-9]。
\D 匹配任何非数字字符；它相当于类 [^0-9]。
\s  匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]
\b  匹配一个特殊字符边界，比如空格 ，&，＃等

其他方法：

#re.split()分割
>>> re.split("\d+","asdahd1231sdad123a")
['asdahd', 'sdad', 'a']

>>> re.split("[ab]","abcd")
['', '', 'cd']


#re.sub()替换
>>> re.sub("\d","*","l1h2c3")
'l*h*c*'

>>> re.sub("\d","*","l1h2c3",1)
'l*h2c3'
#后面的1代表替换几个。

>>> re.subn("\d","*","l1h2c3",2)
('l*h*c3', 2)
>>> re.subn("\d","*","l1h2c3")
('l*h*c*', 3)

#同理re.subn就是代表将替换的后的结果和要替换的个数组成一个元组的形式


#re.compile()编译

>>> obj=re.compile("\d+")
>>> obj.findall("asdasd1231")
['1231']
>>> obj.findall("asd234asdasd1231")
['234', '1231']

#就是将规则先定义好然后在进行调用。将一步分成两步来执行
#减少代码重复性。如果就调用一次的话，不推荐用

time模块

在python中，常用通用有这几种方式来表示时间：

　　时间戳（timestamp）：通常来说，时间戳表示从1970年1月1日00：00：00开始按秒计算的偏移量。我们运行“type(time.time())”,返回类型是float类型

　　格式化的时间字符串(Format String)

　　结构化的时间(struct_time)：struct_time元组共有九个元素(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)

import time

print (time.time())
#时间戳
print(time.strftime("%Y-%m-%d %X"))
#格式化时间
print(time.localtime())
#本地时间
print(time.gmtime())
#国际时间

x=(time.localtime())#将本地时间赋予变量x
print(x.tm_year) #通过x.的方式取出年月日
print(x.tm_mon)
print(x.tm_mday)

print(time.gmtime())#跟上面的用法一样。不一样的是小时。我们中国属于东八区

其中计算机认识的时间只能是时间戳的格式，而程序员可以处理为人类可以看懂的时间。格式化的时间字符串。结构化的时间，于是就有了下图的转换关系

图片来源:点击这里

import time

print(time.localtime(123456)) #使用time.localtime可以将时间戳转换为结构化时间
print(time.localtime(time.time()))#同上，获取当前时间戳，转换成本地结构化时间
print(time.gmtime(time.time()))#同上，转换成国际结构化时间

print(time.mktime(time.localtime()))#将本地结构化时间转换成时间戳
print(time.mktime(time.gmtime()))#将国际结构化时间转换成时间戳

print(time.strftime("%Y-%m-%d %X",time.localtime()))#将本地结构化时间转换成格式化时间
print(time.strftime("%Y-%m-%d %X",time.gmtime()))#将国际结构化时间转换成格式化时间
print(time.strptime('2017-04-11 00:00:00',"%Y-%m-%d %X"))#将格式化时间转换成结构化时间

还有另外一种格式化时间请看图二

图片来源：点击这里

import time
print(time.asctime())#默认不加参数输出结果像linux系统上输出的结果，添加的参数为结构化时间time.localtime
print(time.ctime()) #同上，将时间戳的转换结果输出，添加参数必须为时间戳

time.sleep(10)
print('--->')
#sleep睡几秒

random模块

随机模块

import random
print(random.random())#大于0且小于1之间的小数,每次都是小数，不能指定范围
print(random.uniform(1, 3))#同上，可以指定范围
print(random.randint(1, 3))#[1,3] 大于等于1且小于等于3之间的整数
print(random.randrange(1, 3))#[1,3)大于等于1且小于3之间的整数
print(random.choice([1, '23', [4, 5]]))#自己定义一个列表，随机取出列表里的元素1或者23或者[4,5]
print(random.sample([1, '23',3,4,5,6,[4, 5]], 3))#自定义列表，随机出去列表元素任意2个组合，逗号后面跟几就是每次随机取几个

item = [1, 3, 5, 7, 9]
random.shuffle(item)  # 打乱item的顺序,相当于"洗牌"
print(item)

import random
def get_code():
    res=''
    for i  in range(6):
        num=random.randint(0,9)
        num=str(num)
        zimu=chr(random.randint(97,122))  #数字对应字母
        res +=random.choice([num,zimu])
    return res
X=get_code()
print(X)

小测试--随机生成验证码

OS模块

os模块是与操作系统交互的一个接口

os.getcwd() 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录；相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名：('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')    生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符，win下为"\\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符，win下为"\t\n",Linux下为"\n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令，直接显示
os.environ  获取系统环境变量
os.path.abspath(path)  返回path规范化的绝对路径
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是绝对路径，返回True
os.path.isfile(path)  如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

常用操作

print(os.path.split('/a/b/c/d.txt'))#将路径一分为二
print(os.path.dirname(os.path.abspath(__file__)))#取出当前绝对路径
print(os.path.basename(os.path.abspath(__file__)))#取出当前文件名
dir1=(os.path.split(os.path.abspath(__file__))) #通过切割来取出路径或者文件
print(dir1[1])

import os
#在Linux和Mac平台上，该函数会原样返回path，在windows平台上会将路径中所有字符转换为小写，并将所有斜杠转换为饭斜杠。
print(os.path.normcase('C:/windows\\system32\\'))#在linux上没有任何效果

print(os.path.normpath('c://windows\\System32\\../Temp/'))#同上，'..'返回上一级，

路径处理
import os,sys
#方法一
BASE_DIR=(os.path.dirname(os.path.dirname((os.path.abspath(__file__)))))

方法二
BASE_DIR2= os.path.normpath(os.path.join(
    os.path.abspath(__file__),
    os.pardir,
    os.pardir,
))

sys模块

sys.argv           命令行参数List，第一个元素是程序本身路径
sys.exit(n)        退出程序，正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

import sys,time
for i in range(50):
    sys.stdout.write('%s\r ' %('#'*i))
    sys.stdout.flush()
    time.sleep(0.1)

进度条

shutil模块

高级的文件，文件夹，压缩包处理模块

import shutil
# shutil.copyfileobj(open('old','r'),open('new','w'))
##将文件内容拷贝到另一个文件中

# shutil.copyfile('old','old2')
##拷贝文件

# shutil.copymode('old','new')
# #拷贝权限，内容，组，用户均不变

# shutil.copystat('old','new')
## 拷贝状态信息，包括：mode bits，atime，mtime，flags

# shutil.copy('new','old2')
##拷贝文件和权限

# shutil.copy2('new','old1')
#拷贝文件和状态信息

# shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*'))
#目标目录不能存在，注意对folder2目录父级目录要有可写权限，ignore的意思是排除，硬链接
# shutil.copytree('f1', 'f2', symlinks=True, ignore=shutil.ignore_patterns('*.pyc', 'tmp*'))
##同上，软连接

# shutil.rmtree('/a/b/c')
# #递归删除目录或文件

# shutil.move('/a/b/c','/d/c/b')
#递归去移动文件，类似于mv

import shutil
# ret=shutil.make_archive('old','gztar',root_dir='/data')
#压缩并指定目录，默认为当前目录

import zipfile
# z = zipfile.ZipFile('test.zip', 'w')
# z.write('old')
# z.write('new')
# z.close()
# 压缩

# z = zipfile.ZipFile('test.zip','r')
# z.extractall(path='.')
# z.close()
#解压

解压与压缩操作

import tarfile
# t=tarfile.open('test.tar','w')
# t.add('new',arcname='new.bak')
# t.add('old',arcname='old.bak')
# t.close()
# # 压缩

# t=tarfile.open('test.tar','r')
# t.extractall('.')
# t.close()
# #解压

tarfile解压与压缩

json与pickle模块

　　之前我们学习过用eval内置方法可以将一个字符串转成python对象，不过，eval方法是有局限性的，对于普通的数据类型，json.loads和eval都能用，但遇到特殊类型的时候，eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式，并返回表达式的值。

import json
x="[null,true,false,1]"
print(eval(x)) #报错，无法解析null类型，而json就可以
print(json.loads(x))

什么是序列化？

　　我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

为什么要有序列化

　　1：持久保存状态

　　要知道一个程序或者软件的执行，就是在处理一系列状态的变化，在编程语言中，‘状态’会以各种各样有结构的的数据类型的形式被保存在内存中

　　内存是无法永久保存数据的，当程序运行了一段时间，我们断电或者重启程序，内存中关于这个程序的之前一段时间的数据（有结构）都被清空了。

　　在断电或重启程序之前将程序当前内存中所有的数据都保存下来（保存到文件中），以便于下次程序执行能够从文件中载入之前的数据，然后继续执行，这就是序列化。

　　具体的来说，你玩使命召唤闯到了第13关，你保存游戏状态，关机走人，下次再玩，还能从上次的位置开始继续闯关。或如，虚拟机状态的挂起等。

　　2：跨平台数据交互

　　序列化之后，不仅可以把序列化后的内容写入磁盘，还可以通过网络传输到其他机器上，如果收发的双方约定好使用一种序列化的格式，那么便打破了平台/语言差异带来的限制，实现了跨平台数据交互

　　反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

如何使用json和pickle：

图片来源：点击这里

import  json

dic={'name':'jack','age':'18','sex':'man'}
# print(type(dic))    #没序列化之前是字典格式
#
# j=json.dumps(dic)
# print(type(j))  #序列化后就是字符串格式

# f=open('dict.txt','w')
# f.write(j)
# f.close()   #将序列化文件存放到文件中

# f=open('dict.txt','r')
# date=json.loads(f.read())
# print(type(date))   #反序列化

json.dump(dic,open('db.json','w'))  #第二种方法
date=json.load(open('db.json','r'))
print(date['hoppy'][0])

pickle方法

图片来源：点击这里

import pickle
dic={'name':'jack','age':'18','sex':'man','hoppy':['eat','drink','play']}
j=pickle.dumps(dic)
print(type(j))      #序列化后为bytes类型

with open('db.pickle','wb') as f:
    f.write(j)      #写入文件的时候也要用wb方式。

with open('db.pickle','rb') as F:
    date_pk=F.read()
date=pickle.loads(date_pk)
print(date)             #pickle反序列化

#第二种方法
import pickle
dic={'name':'jack','age':'18','sex':'man','hoppy':['eat','drink','play']}

pickle.dump(dic,open('db.pk','wb'))
#序列化
date=pickle.load(open('db.pk','rb'))
print(date)
#反序列化

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系

后续的一些其它重要模块会慢慢补上。

posted @ 2017-03-16 16:42 沧澜猛兽阅读(12001) 评论(0) 编辑收藏举报

刷新页面返回顶部

随风

别人笑我太疯癫，我笑他人看不穿

python模块与包的导入

公告