python基础------模块

一，日志模块：logging

 1 #简单应用
 2 import logging
 3 logging.debug("hello python")
 4 logging.info("hello world")
 5 logging.warning("hello java")  #日志级别默认WARNUNG 只显示warning一下的，上面的debug，info没打印出来
 6 logging.error("hello C")
 7 logging.critical("hello C++")
 8 
 9 #打印结果：
10 #WARNING:root:hello java
11 #ERROR:root:hello C
12 #CRITICAL:root:hello C++
13 #

日志的等级从下到上：critical-->error-->warning-->info-->debug

2,灵活设置日志等级，位置，日志格式

 1 import logging
 2 #日志等级设置成debug
 3 logging.basicConfig(level=logging.DEBUG,  #日志等级设置成debug
 4                     format="%(asctime)s %(filename)s %(levelname)s %(message)s",
 5                     filename = "test.txt", #设置文件名
 6                     filemode = "w",    #以w模式写入内容
 7                     )
 8 logging.debug("debug message")
 9 logging.info("info message")
10 logging.warning("warning message")
11 logging.error("error message")
12 logging.critical("critical message")

2.1 test.txt文件中的内容：

2017-04-27 19:29:49,808 logging模块.py DEBUG debug message
2017-04-27 19:29:49,825 logging模块.py INFO info message
2017-04-27 19:29:49,826 logging模块.py WARNING warning message
2017-04-27 19:29:49,826 logging模块.py ERROR error message
2017-04-27 19:29:49,826 logging模块.py CRITICAL critical message

2.2 format中可能用到的格式化串

 1 '''
 2 
 3 %(name)s Logger的名字
 4 %(levelno)s 数字形式的日志级别
 5 %(levelname)s 文本形式的日志级别
 6 %(pathname)s 调用日志输出函数的模块的完整路径名，可能没有
 7 %(filename)s 调用日志输出函数的模块的文件名
 8 %(module)s 调用日志输出函数的模块名
 9 %(funcName)s 调用日志输出函数的函数名
10 %(lineno)d 调用日志输出函数的语句所在的代码行
11 %(created)f 当前时间，用UNIX标准的表示时间的浮 点数表示
12 %(relativeCreated)d 输出日志信息时的，自Logger创建以 来的毫秒数
13 %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
14 %(thread)d 线程ID。可能没有
15 %(threadName)s 线程名。可能没有
16 %(process)d 进程ID。可能没有
17 %(message)s用户输出的消息
18 '''

2.3 logger对象方法：推荐用法

 1 import logging
 2 #日志模块
 3 def get_logger():
 4     logger = logging.getLogger() #获得一个logger对象
 5 
 6     fh = logging.FileHandler("a.txt") # 创建一个文件流,需要给一个文件参数
 7 
 8     sh = logging.StreamHandler()  #创建一个屏幕流，
 9 
10     logger.setLevel(logging.DEBUG) #设定最低等级debug
11     #写入文件的中的格式
12     fm = logging.Formatter("%(asctime)s - %(name)s - %(levelname)s - %(message)s")
13 
14     logger.addHandler(fh)#把文件流添加进来，流向文件
15     logger.addHandler(sh) #把屏幕流添加进来，流向屏幕
16 
17     fh.setFormatter(fm) #在文件流添加写入格式
18     sh.setFormatter(fm) #在屏幕流添加写入格式
19 
20     return logger
21 
22 logger = get_logger()
23 logger.debug("hello world")
24 logger.info("world python")
25 logger.warning("hello java")
26 logger.error("python C")
27 logger.critical("hello C++")

2.3 a.txt文件中内容

 1 #内容都是一样的，只是两个流派都弄出来了
 2 
 3 #屏幕上的内容：
 4 2017-04-27 19:57:38,336 - root - DEBUG - hello world
 5 2017-04-27 19:57:38,337 - root - INFO - world python
 6 2017-04-27 19:57:38,337 - root - WARNING - hello java
 7 2017-04-27 19:57:38,337 - root - ERROR - python C
 8 2017-04-27 19:57:38,338 - root - CRITICAL - hello C++
 9 
10 
11 #文件中的内容：
12 2017-04-27 19:57:38,336 - root - DEBUG - hello world
13 2017-04-27 19:57:38,337 - root - INFO - world python
14 2017-04-27 19:57:38,337 - root - WARNING - hello java
15 2017-04-27 19:57:38,337 - root - ERROR - python C
16 2017-04-27 19:57:38,338 - root - CRITICAL - hello C++

二：序列化模块：json 重要

1，只有两个方法，1.1，序列化方法，1.2，反序列方法

如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

 1 import json,os
 2 # d={"name":"egon"}
 3 #
 4 # s =json.dumps(d)
 5 #
 6 # f = open("b.txt","w")
 7 # f.write(s)
 8 #
 9 # f.close()
10 # a=open("b.txt")
11 # data = a.read()
12 # data2 = json.loads(data)
13 # print(data2["name"])
14 # a.close()
15 
16 #序列化方法,就是把数据以json字符串形式写入到文件
17 d = {"name":"egon"}
18 
19 j = json.dumps(d) #把字典转成json字符串
20 
21 f = open("b.txt","w")
22 f.write(j)  #等同于data = json.dump(d,f)
23 f.close()
24 
25 #反序列化方法，
26 f = open("b.txt")
27 data = json.loads(f.read())  #把文件中的json字符串读出来，以字典的格式
28 print(data["name"])   #egon
29 f.close()

三，pickle 模块

跟json差不多，只能在python之间用，有局限性

四，os模块，正则表达式

元字符：

1， . 通配符，可以代替除了\n之外的所有字符

2， + 重复前一个字符1到无穷次

3， * 重复前一个字符0到无穷次

4， ? 重复前一个字符0到1次

5， ^ 从字符串开头匹配，在[]里就是取反的意思

6， $ 从字符串结尾匹配

7， | 或的关系

8， \ 转义符 1，在元字符前加上\使其变成普通的字符，2，将普通字符变成有特殊功能的符号，后面会介绍

9， () 分组在有()的时候匹配，优先匹配可以在()里加上?:取消优先级，不要问我为什么，这是语法

10， {} 可以指定范围，还可以指定重复次数

11， [] * + . 在列表里都是普通字符， - ^ \ 还有特殊意义

  1 import re
  2 
  3 #  .
  4 print(re.findall("e.l","hello"))  #['ell']
  5 print(re.findall("o...r","hello world")) #['o wor']
  6 
  7 #  +
  8 print(re.findall("a+","aab"))   #['aa']
  9 print(re.findall("ab+","abbbbcc"))  #['abbbb']
 10 
 11 #  *
 12 print(re.findall("ab*","abbbc"))  #['abbb']
 13 print(re.findall("abbc*","abbbb"))# ['abb'] *是从0次开始
 14 
 15 # + *都是贪婪匹配 在后面加上？就变成惰性匹配了
 16 print(re.findall("ab+?","abbbcd")) #['ab']
 17 print(re.findall("ab*?","abbbcd")) #['a']
 18 
 19 #  ？
 20 print(re.findall("ab?","abbc")) #['ab']
 21 print(re.findall("abcc?","abccc")) #['abcc']
 22 
 23 #  ^
 24 print(re.findall("^hello","helloworld")) #['hello']
 25 print(re.findall("^hello","pthon"))    # []
 26 
 27 #  $
 28 print(re.findall("ern$","pattern"))  # ['ern']
 29 print(re.findall("erl$","pattern"))  # []
 30 
 31 #  |
 32 print(re.findall("(ab)|\d","addfab45vj")) #['ab', '', '']
 33 data = re.search("(ab)|\d","addfab45vj")
 34 print(data.group())    #ab
 35 
 36 #  \
 37 print(re.findall("a\d","a34d51")) #['a3']
 38 print(re.findall("h\*e","h*ello")) #['h*e']
 39 '''
 40 \d  匹配任何十进制数；它相当于类 [0-9]。
 41 \D 匹配任何非数字字符；它相当于类 [^0-9]。
 42 \s  匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。
 43 \S 匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。
 44 \w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。
 45 \W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]
 46 \b  匹配一个特殊字符边界，比如空格 ，&，＃等
 47 '''
 48 print(re.findall("\d","h*el3l452o")) #['3', '4', '5', '2']
 49 print(re.findall("\D","h4e3ll2o"))   #['h', 'e', 'l', 'l', 'o']
 50 print(re.findall("\s","h e\tl\rl\vo")) #[' ', '\t', '\r', '\x0b']
 51 print(re.findall("\S","h\te\nllo"))    #['h', 'e', 'l', 'l', 'o']
 52 print(re.findall("\w","h2<>3*l4"))     #['h', '2', '3', 'l', '4']
 53 print(re.findall("\W","h*2j$3\no")) #['*', '$', '\n']
 54 print(re.findall("\b","h*ello"))  #[]
 55 
 56 # {}
 57 print(re.findall("b{2}","abbbbc")) #['bb', 'bb'] 指定重复2次
 58 print(re.findall("ab{1,3}","abbbbbc")) #['abbb']  指定范围，1到3次重复
 59 
 60 # ()
 61 print(re.findall(r"(ab)+c","ababc"))#['ab'] 因为括号的优先级，只显示括号内的匹配内容，括号外的+是匹配到了只是没显示出来
 62 print(re.findall(r"(?:ab)+c","ababc")) #['ababc'] 加上？:取消括号的优先级，结果都显示出来了
 63 
 64 # []
 65 print(re.findall("a[bc]d","acd"))#['acd'] 匹配列表中的任意一个 只要满足就匹配出来了
 66 print(re.findall("a[bc]d","abd"))#['abd']
 67 
 68 print(re.findall("[*+.]","da.j34*js+")) #['.', '*', '+'] .* + 在列表内都是普通字符
 69 print(re.findall("[^\d]","she231j")) #['s', 'h', 'e', 'j'] ^在列表内表示取反
 70 print(re.findall("[a-z]","hello")) #['h', 'e', 'l', 'l', 'o'] - 在列表内表示a-z的范围都取
 71 print(re.findall("[A-Z]","HeLLo")) #['H', 'L', 'L'] 只取A-Z的大写英文字母
 72 print(re.findall("[0-9]","h1e2l3l4o5")) #['1', '2', '3', '4', '5'] 只取0-9的数字
 73 print(re.findall("[\s]","\nsa")) # ['\n'] \还是有特殊意义
 74 
 75 # r 在匹配规则前加上，使在ascll码类有特殊意义的变成原生字符串
 76 #print(re.findall('c\l','abc\le')) #[] \l在ascll码表里有站位，所以匹配不出来
 77 print(re.findall('c\\\\l','abc\le')) #['c\\l']
 78 print(re.findall(r"c\\l","abc\le")) #['c\\l'] 变成原生字符串
 79 
 80 # re方法
 81 
 82 # re.finddall  #返回所有满足匹配条件的结果,放在列表里
 83 ret = re.findall("ab","abcaa")
 84 print(ret) #['ab']
 85 
 86 # re.finditer  可迭代对象，迭代器
 87 ret = re.finditer("a","abacdef")
 88 print(next(ret).group()) #a
 89 print(next(ret).group()) #a
 90 
 91 # re.seach 只匹配第一个结果  函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以
 92                         # 通过调用group()方法得到匹配的字符串,如果字符串没有匹配，则返回None。
 93 ret = re.search("\d","h31el34l5o0")
 94 print(ret.group()) # 3
 95 
 96 # re.math 只在字符串开始的位置匹配
 97 ret = re.match("he","hello")
 98 print(ret.group()) # he
 99 
100 # re.split 分割 先按l分割，得到'he',''和lo,在从'',lo开始分割,得到下面结果
101 ret = re.split("l","hello")
102 print(ret)  # ['he', '', 'o']
103 
104 # re.sup 替换
105 ret = re.sub("l","A","hello")
106 print(ret)  # heAAo
107 
108 #re.subn 替换 返回元组 可以选择添加替换次数,不添加次数，默认字符串里有几个就替换几个
109 ret = re.subn("l","A","hello")
110 print(ret) # ('heAAo', 2)
111 
112 ret = re.subn("l","A","hello",1)
113 print(ret) # ('heAlo', 1)
114 
115 
116 #compile 编译方法 好处：对于多个字符串处理效率高
117 c = re.compile("he") #匹配规则
118 ret = c.findall("hellohe") #匹配内容
119 print(ret) #['he', 'he']

posted @ 2017-04-27 20:01 九级大狂风阅读(193) 评论(0) 编辑收藏举报

刷新页面返回顶部

九级大狂风