python基础-7模块,第三方模块安装方法,使用方法。sys.path os sys time datetime hashlib pickle json requests xml

模块,用一砣代码实现了某个功能的代码集合。 

类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.py文件中),n个 .py 文件组成的代码集合就称为模块。

如:os 是系统相关的模块;file是文件操作相关的模块

模块分为三种:

  • 自定义模块,文件或文件夹
  • 内置模块
  • 开源模块

一 第三方模块安装

 1 # python 安装第三方模块
 2 # 加入环境变量 : 右键计算机---属性---高级设置---环境变量---path--分号+python的scripts路径
 3 (1) python管理工具 pip
 4 # python3 -m pip install requests  # 3版本安装
 5  
 6  (2) 源码安装
 7     解压
 8     cmd
 9     进到你下载的包路径
10     python setup.py install #选择你要安装的Python版本。

windows下安装开源模块 

报错

1 pip install django                                                                  
2 Fatal error in launcher: Unable to create process using '"'

解决方法

1 python -m pip install package
 1 如果找不到pip命令可以去scripts目录下
 2  安装报错                                                                                     
 3 C:\Python35\Scripts                                                                   
 4 λ pyip install django                                                                 
 5 Fatal error in launcher: Unable to create process using '"'                           
 6                                                                                         
 7 C:\Python35\Scripts                                                                   
 8 λ pip install django                                                                  
 9 Fatal error in launcher: Unable to create process using '"' 
10  
11 解决 python -m pip install package
12  
13 C:\Python35\Scripts                                                                   
14 λ python -m pip install requests                                                      
15 Collecting requests                                                                   
16   Downloading requests-2.10.0-py2.py3-none-any.whl (506kB)                            
17     100% |████████████████████████████████| 507kB 144kB/s                             
18 Installing collected packages: requests                                               
19 Successfully installed requests-2.10.0                                                
20 You are using pip version 7.1.2, however version 8.1.2 is available.                  
21 You should consider upgrading via the 'python -m pip install --upgrade pip' command.                            
22                                                                                         
23 C:\Python35\Scripts                                                                   
24 λ piython -m pip install django                                                       
25 Collecting django                                                                     
26   Downloading Django-1.9.6-py2.py3-none-any.whl (6.6MB)                               
27     100% |████████████████████████████████| 6.6MB 64kB/s                              
28 Installing collected packages: django                                                 
29 Successfully installed django-1.9.6                                                   
30 You are using pip version 7.1.2, however version 8.1.2 is available.                  
31 You should consider upgrading via the 'python -m pip install --upgrade pip' command.  
32                                                                                         
33                                                  
34 C:\Python35\Scripts                                                                   
35 λ python3 -m pip install django                                                       
36 Collecting django                                                                     
37   Using cached Django-1.9.6-py2.py3-none-any.whl                                      
38 Installing collected packages: django                                                 
39 Successfully installed django-1.9.6                                                   
40 You are using pip version 7.1.2, however version 8.1.2 is available.                  
41 You should consider upgrading via the 'python -m pip install --upgrade pip' command.  

二 自定义模块

也就是自己写的python脚本,而目录就是所谓的包

1 定义模块

 

 2 导入模块

Python之所以应用越来越广泛,在一定程度上也依赖于其为程序员提供了大量的模块以供使用,如果想要使用模块,则需要导入。导入模块有一下几种方法:

1 import module
2 from module.xx.xx import xx
3 from module.xx.xx import xx as rename
4 from module.xx.xx import *

2 .2 导入模块后如何调用

 1 第一种:
 2 from lib import account
 3 ret = account.login()  #  导入模块,这里方法调用必须用模块
 4 print(ret)
 5 第二种:
 6 from lib.account import login  #这里如果直接导入方法,需要包.模块
 7 ret = login()
 8 print(ret)
 9 第三种
10 import lib.account  #如果是直接import
11 ret = lib.account.login() #调用时候需要从头开始写
12 print(ret)
13 第四种:
14 from lib.account import login as l  #as使用
15 ret = l()
16 print(ret) 
17  
18  
19 account 文件
20 #!/usr/bin/env python
21 # _*_ coding:utf-8 _*_

23  
24 def login():
25     return "login"
26  
27 def register():
28     return "register"
29  
30 def logout():
31     return "logout"

3 模块默认查找路径

导入模块其实就是告诉Python解释器去解释那个py文件  

  • 导入一个py文件,解释器解释该py文件
  • 导入一个包,解释器解释该包下的 __init__.py 文件 【py2.7】

 

那么问题来了,导入模块时是根据那个路径作为基准来进行的呢?即:sys.path,根据sys.path下的路径去找。

 

 

1 import sys
2 print(sys.path)
3 
4 
5 
6 C:\Python35\python3.exe E:/py/55/learn-python/oldboy/6/mk.py
7 ['E:\\py\\55\\learn-python\\oldboy\\6', 
  'E:\\py\\55\\learn-python\\oldboy',
  'C:\\Python35\\python35.zip',
  'C:\\Python35\\DLLs',
  'C:\\Python35\\lib',
  'C:\\Python35',
  'C:\\Python35\\lib\\site-packages']

4 将某个路径加入到环境变量

如果sys.path路径列表没有你想要的路径,可以通过 sys.path.append('路径') 添加。

1 # 将d盘写的一个脚本加入到sys路径,这样D盘下面的py文件就可以作为模块直接用。
2 import sys
3 sys.path.append("D:")
4 import buy
5 ret = buy.fun()
6 print(ret)<br><br>
1 import sys
2 import os
3  
4 pre_path = os.path.abspath('../')
5 sys.path.append(pre_path)

三 内置模块

1 、os

用于提供系统级别的操作

 1 os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
 2 os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
 3 os.curdir  返回当前目录: ('.')
 4 os.pardir  获取当前目录的父目录字符串名:('..')
 5 os.makedirs('dirname1/dirname2')    可生成多层递归目录
 6 os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
 7 os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
 8 os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
 9 os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 ls
10 os.remove()  删除一个文件 rm
11 os.rename("oldname","newname")  重命名文件/目录
12 os.stat('path/filename')  获取文件/目录信息,包含文件大小。
13 os.sep    输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
14 os.linesep    输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
15 os.pathsep    输出用于分割文件路径的字符串
16 os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
17 os.system("bash command")  运行shell命令,直接显示,模拟一个人的操作,
18 os.environ  获取系统环境变量
19 os.path.abspath(path)  返回path规范化的绝对路径
20 os.path.split(path)  将path分割成目录和文件名二元组返回
21 os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
22 os.path.basename(path)  返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
23 os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
24 os.path.isabs(path)  如果path是绝对路径,返回True
25 os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
26 os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
27 os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
28 os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
29 os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
 1 #!/usr/bin/env python
 2 # _*_ coding:utf-8 _*_

 4 import os
 5  
 6 print(os.getcwd())
 7 # 测是 chdir 切换目录,切换到上级目录
 8 # pwd =os.getcwd()
 9 # li = pwd.split("\\")
10 # del li[-1]
11 # pwd='\\'.join(li)
12 # print(pwd)
13 # os.chdir(pwd)
14 # print(os.getcwd())
15  
16 print(os.curdir) # 返回.
17 a = os.pardir
18 print(a)  # 返回是..
19 # os.makedirs("a/b/c")
20 # os.makedirs("a/b")  #在本层目录下创建a/b
21 # os.removedirs("a/b") # b为空,删除b后,a也为空,则都删除 否则哪级不为空就会报错
22 # os.mkdir("b")  #创建目录
23 # print(os.listdir('a/b')) #列出目录内一层的内容包括隐藏目录
24 # os.remove('a/b/圣达菲.py') # 删除b下的文件
25 # os.rmdir("b")# 删除空目录 否则报错
26 # os.rename("a","b") # 重命名文件或者目录
27 # print(os.stat("b")) #获取目录信息
28 # print(os.sep) # 输出路径分隔符 linux / windows //
29 # print(os.linesep) #输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"
30 # print(os.pathsep) #输出用于分割文件路径的字符串
31 # print(os.name) #输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
32 # os.system("ip ro") #必须在linux手动执行脚本
33 # print(os.environ) #获取环境变量
34 # print(os.path.abspath("b")) # # 获取b目录规范化的绝对路径
35 # print(os.path.split("b")) #将传入的字符串路径分割成目录和文件名二元数组返回 ('', 'b')
36 print(os.path.dirname("a/b")) #获取最后一个目录之前的路径
37 print(os.path.exists('/b/c')) #判断是否存在 返回True 或者false
38 print(os.path.basename('a/b/c')) #获取最后一层目录
39 print(os.path.isabs('a/b/c')) #是否是绝对路径
40 print(os.path.isfile('b/sss')) #最后一个名是否是文件 返回True 或者false
41 print(os.path.isdir('a/b'))#最后一个名是否是目录 返回True 或者false
42 print(os.path.join("a/b/c","b/b")) #a/b/c\b/b
43 print(os.path.getatime("a/b/c"))
44 print(os.path.getmtime("a/b/c"))

案例:

根据用户输入创建目录

1 import os,sys
2 dirname = input("input ur dir name:").strip()
3 dir_path = os.getcwd() #获取当前脚本所在目录
4 new_path = r"%s\%s"%(dir_path,dirname) #拼接输入名与目录路径
5 if not os.path.exists(new_path):
6     os.mkdir(new_path)

os 模块常用 功能 dirname basename join

这里先介绍 内置函数vars()

每个py文件相当于一个模块,而这个文件的许多方法,可以用print(var())

1 print(vars())
2 
3 -----------------
4 C:\Python35\python3.exe E:/py/55/learn-python/oldboy/6/module_test2.py
5 {'__name__': '__main__', '__cached__': None, '__loader__': <_frozen_importlib_external.SourceFileLoader object at 0x00000226A98E5BE0>, '__doc__': None, '__builtins__': <module 'builtins' (built-in)>, '__spec__': None, '__file__': 'E:/py/55/learn-python/oldboy/6/module_test2.py', '__package__': None}

__doc__ #py文件开头的注释文字

__file__ #当前py文件的路径

__package__ #包含文件所在包,用 . 分隔,当前文件为None,导入的其他文件:指定文件所在包,用.分隔。

__cached__ #文件的缓存

      #当前文件没有,导入的其他文件有缓存

__name__ #如果是主文件,__name__==__main__,否则,等于模块名。用作执行的条件判断。

1、主文件

调用主函数前 ,必须加判断。if __name__==__main__:

2、__file__

当前文件的路径,

返回当前文件的目录

 1 print(__doc__) # python文件的注释 三引号 注释必须在开头,
 2  
 3 print(__file__) #自身脚本文件加路径
 4 print(__package__) # 当前文件为None
 5 from s12_mokuai import s1
 6 print(s1.__package__) # 导入模块文件的文件: 则输出导入模块文件的所在目录
 7  
 8 #
 9 # from s12_mokuai import s1
10 # print(s1.__cached__) #导入的文件,则输出其缓存目录
1 print(__cached__)    #没有导入 当前文件的缓存为None,

文件路径及目录,获取文件名等等操作

 1 import os
 2 print(__file__)#文件的路径
 3 print(os.path.dirname(__file__))#返回文件的目录,文件的上层
 4 print(os.path.dirname(os.path.dirname(__file__)))#上层的上层
 5 print(os.path.basename(__file__))#返回文件名
 6 
 7 --------------------------
 8 
 9 C:\Python35\python3.exe E:/py/55/learn-python/oldboy/6/module_test2.py
10 E:/py/55/learn-python/oldboy/6/module_test2.py
11 E:/py/55/learn-python/oldboy/6
12 E:/py/55/learn-python/oldboy
13 module_test2.py

重点1 而 __name__的重要性不言而喻

当我们的程序只有一个入口的时候,如果加入if __name__ == "__main__": 那么我们程序主文件被导入的时候__name__的值是模块的名字,程序主程序是不执行的。

1 print(__name__) # 当执行该脚本时候输出为 __main__ 而当被导入的时候是其模块名称
# 主文件
# 调用主函数前,必须 if __name__ == "__main__":

重点2 __file__  #自身脚本文件加路径

假如当前脚本所在目录还有一个目录,python里面称为包,而这个包下有好多模块,也就是py文件,我们如果想调用,怎么用呢??这就用到os模块的 三个方法basename dirname join 还有我们刚提到的__file__  还有 sys的path方法

1 import os,sys
2 print(os.path.dirname(__file__))
3 p1 = os.path.dirname(__file__)#返回文件的目录,文件的上层
4 p2 = os.path.basename(__file__)#返回文件的文件名
5 new_dir = os.path.join(p1,p2)#拼接成路径
6 sys.path.append(new_dir)#加入到sys.path

 2、sys

用于提供对解释器相关的操作

1 sys.argv           命令行参数List,第一个元素是程序本身路径
2 sys.exit(n)        退出程序,正常退出时exit(0)
3 sys.version        获取Python解释程序的版本信息
4 sys.maxint         最大的Int值
5 sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
6 sys.platform       返回操作系统平台名称
7 sys.stdout.write('please:')
8 val = sys.stdin.readline()[:-1]

2.1 argv 将文件名和参数做成列表返回

1 import sys
2 print(sys.argv)
3  
4 saltstack_s:/share/py_test/s8 #  py s9_argv.py 9 9 9 9
5 ['s9_argv.py', '9', '9', '9', '9']

sys.stdout.write()

sys.stdout.flush()刷新屏幕缓存io

1 #进度条案例
2 import time,sys
3 for i in range(101):
4    #显示进度条百分比  #号从1开始 空格从99递减
5    hashes = '#' * int(i / 100.0 * 100)
6    spaces = ' ' * (100 - len(hashes))
7    sys.stdout.write("\r[%s] %s%%" % (hashes + spaces, i))  #必须两个%%才是,因为一个%是取模,python解释器会默认过滤
8    sys.stdout.flush() #强制刷新屏幕缓冲区使其一行输出
9    time.sleep(0.05)
1 import time
2 import sys
3 for i in range(30):
4    sys.stdout.write('\r')
5    sys.stdout.write("%s%%|%s" % (int(i/30*100),int(i/30*100)*"*"))
6    sys.stdout.flush()
7    time.sleep(0.3)

3 time datatime模块

时间相关的操作,时间有三种表示方式:

  • 时间戳               1970年1月1日之后的秒,即:time.time()
  • 格式化的字符串    2014-11-11 11:11,    即:time.strftime('%Y-%m-%d')
  • 结构化时间          元组包含了:年、日、星期等... time.struct_time    即:time.localtime()
 1 print time.time()  # 时间戳  1970年1月1日开始计时   unix系统诞生 1463840728.7381186
 2 print time.mktime(time.localtime()) #mktime 接收结构化的对象时间  转换为时间戳 1463470373.0
 3    
 4 print time.gmtime()    #可加时间戳参数 # 结构化UTC时间返回 元组返回   年、日、星期 time.struct_time(tm_year=2016, tm_mon=5, tm_mday=17, tm_hour=7, tm_min=26, tm_sec=11, tm_wday=1, tm_yday=138, tm_isdst=0)
 5 print time.localtime() #可加时间戳参数  #结构化计算机本地时间返回  time.struct_time(tm_year=2016, tm_mon=5, tm_mday=17, tm_hour=15, tm_min=31, tm_sec=26, tm_wday=1, tm_yday=138, tm_isdst=0)
 6 print time.strptime('2014-11-11', '%Y-%m-%d')  print(time.strftime("%Y-%m-%d %H:%M",time.gmtime()))  #   2016-05-21 14:25
 7    
 8 print time.strftime('%Y-%m-%d') #默认当前时间
 9 print time.strftime('%Y-%m-%d',time.localtime()) #默认当前时间
10 print time.asctime()
11 print time.asctime(time.localtime())
12 print time.ctime(time.time())
13    
14 import datetime
15 '''
16 datetime.date:表示日期的类。常用的属性有year, month, day
17 datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond
18 datetime.datetime:表示日期时间
19 datetime.timedelta:表示时间间隔,即两个时间点之间的长度
20 timedelta([days[, seconds[, microseconds[, milliseconds[, minutes[, hours[, weeks]]]]]]])
21 strftime("%Y-%m-%d")
22 '''
23 import datetime
24 print datetime.datetime.now()
25 print datetime.datetime.now() - datetime.timedelta(days=5)

 

3.1 time 模块练习

 

时间戳与日期之间的相互转化

 1 当前时间戳:time.time()
 2 当前日期:time.ctime()
 3 1、Python下日期到时间戳的转换
 4 import datetime
 5 import time
 6 dateC=datetime.datetime(2010,6,6,8,14,59)
 7 timestamp=time.mktime(dateC.timetuple())
 8 print timestamp
 9  
10 2、Python下将时间戳转换到日期
11 import datetime
12 import time
13 ltime=time.localtime(1395025933)
14 timeStr=time.strftime("%Y-%m-%d %H:%M:%S", ltime)

 

 1 #!/usr/bin/env python
 2 # _*_ coding:utf-8 _*_
 3 __author__ = 'liujianzuo'
 4 import  time
 5 """
 6 时间相关的操作,时间有三种表示方式:
 7  
 8 时间戳               1970年1月1日之后的秒,即:time.time()
 9 格式化的字符串    2014-11-11 11:11,    即:time.strftime('%Y-%m-%d')
10 结构化时间          元组包含了:等... time.struct_time    即:time.localtime()
11 """
 1 ##################   时间戳 与  结构化时间 转换    ######################
 2 print(time.time()) # 时间戳  1970年1月1日开始计时   unix系统诞生 1463840728.7381186
 3 print(time.ctime()) # 周 月 日  时间 年   Sat May 21 22:25:28 2016
 4 print(time.ctime(time.time())) # 转换时间戳 为 Sat May 21 22:25:28 2016
 5 print(time.ctime(time.time() - 86400))  # 转换时间戳 为 Sat May 21 22:25:28 2016
 6  
 7 print(time.gmtime()) # 结构化UTC时间返回 元组返回   年、日、星期 time.struct_time(tm_year=2016, tm_mon=5, tm_mday=17, tm_hour=7, tm_min=26, tm_sec=11, tm_wday=1, tm_yday=138, tm_isdst=0)
 8 obj = time.gmtime()
 9 print(obj.tm_year) #获取结构化的时间年 2016
10 print(time.localtime()) #结构化计算机本地时间返回  time.struct_time(tm_year=2016, tm_mon=5, tm_mday=17, tm_hour=15, tm_min=31, tm_sec=26, tm_wday=1, tm_yday=138, tm_isdst=0)
11 #结构化时间 转换 时间戳
12  
13 print(time.mktime(time.localtime())) #mktime 接收结构化的对象时间  转换为时间戳 1463470373.0
14 ################## ################## ################## ##################
15  
16 ##################   结构化时间 与  字符串时间转换    ######################
17 #将结构化的对象时间转换为字符串 trftime    即:time.struct_time(tm_year=2016, tm_mon=5,。。。) ===转换为=》 ”%Y-%m-%d %H:%M %s# “
18 print(time.strftime("%Y-%m-%d %H:%M",time.gmtime()))  #   2016-05-21 14:25
19 #将字符串日期 转换为 时间结构对象 strptime    ”%Y-%m-%d %H:%M %s# “ ===转换为=》 time.struct_time(tm_year=2016, tm_mon=5,。。。)
20 print(time.strptime("2016-09-10 10:11","%Y-%m-%d %H:%M"))  #  time.struct_time(tm_year=2016, tm_mon=5, tm_mday=17, tm_hour=15,
21 ################## ################## ################## ##################

3.2 datetime 模块练习

 1 import datetime
 2 '''
 3 datetime.date:表示日期的类。常用的属性有year, month, day
 4 datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond
 5 datetime.datetime:表示日期时间
 6 datetime.timedelta:表示时间间隔,即两个时间点之间的长度
 7 timedelta([days[, seconds[, microseconds[, milliseconds[, minutes[, hours[, weeks]]]]]]])
 8 strftime("%Y-%m-%d")
 9 '''
10 import datetime
11 print datetime.datetime.now()
12 print datetime.datetime.now() - datetime.timedelta(days=5)
  1 # -*- coding: utf-8 -*-
  2  
  3  
  4  #datetime类
  5  #datetime是date与time的结合体,包括date与time的所有信息。
  6  #它的构造函数如下:
  7  #datetime. datetime (year, month, day[ , hour[ , minute[ , second[ , microsecond[ , tzinfo] ] ] ] ] )
  8  #各参数的含义与date、time的构造函数中的一样,要注意参数值的范围。
  9  
 10  
 11  
 12  
 13 # 1. datetime类定义的类属性与方法:
 14 #datetime.min、datetime.max:datetime所能表示的最小值与最大值;
 15 #print: datetime.max: 9999-12-31 23:59:59.999999
 16 #print: datetime.min: 0001-01-01 00:00:00
 17 from  datetime  import  *
 18 import time
 19 print   'datetime.max:' , datetime.max 
 20 print   'datetime.min:' , datetime.min 
 21 #datetime.resolution:datetime最小单位;
 22 #print: datetime.resolution: 0:00:00.000001
 23 print   'datetime.resolution:' , datetime.resolution
 24 #datetime.today():返回一个表示当前本地时间的datetime对象;
 25 #print: today(): 2012-09-12 19:37:50.721000
 26 print   'today():' , datetime.today()
 27 #datetime.now([tz]):返回一个表示当前本地时间的datetime对象,如果提供了参数tz,则获取tz参数所指时区的本地时间;
 28 #print: now(): 2012-09-12 19:37:50.738000
 29 print   'now():' , datetime.now()
 30 #datetime.utcnow():返回一个当前utc时间的datetime对象;
 31 #print: 2012-09-12 11:37:50.739000
 32 print   'utcnow():' , datetime.utcnow() 
 33 #datetime.fromtimestamp(timestamp[, tz]):根据时间戮创建一个datetime对象,参数tz指定时区信息;
 34 #print: fromtimestamp(tmstmp): 2012-09-12 19:37:50.741000
 35 print   'fromtimestamp(tmstmp):' , datetime.fromtimestamp(time.time())
 36 #datetime.utcfromtimestamp(timestamp):根据时间戮创建一个datetime对象;
 37 #print: utcfromtimestamp(tmstmp): 2012-09-12 11:37:50.742000
 38 print   'utcfromtimestamp(tmstmp):' , datetime.utcfromtimestamp(time.time())
 39 #datetime.combine(date, time):根据date和time,创建一个datetime对象;
 40 #print: datetime.combine(date,time):  2012-09-12 19:46:05
 41 d = date(2012,9,12)
 42 from  datetime  import  *
 43 t = time(19,46,5)
 44 print 'datetime.combine(date,time): ',datetime.combine(d,t)
 45 #datetime.strptime(date_string, format):将格式字符串转换为datetime对象;
 46 #print: 2007-03-04 21:08:12
 47 print datetime.strptime("2007-03-04 21:08:12", "%Y-%m-%d %H:%M:%S")
 48  
 49  
 50 #2. datetime类提供的实例方法与属性
 51 dt = datetime.strptime("2012-09-12 21:08:12", "%Y-%m-%d %H:%M:%S")
 52 #print: 2012 9 12 21 8 12 0 None
 53 print dt.year,dt.month,dt.day,dt.hour,dt.minute,dt.second,dt.microsecond,dt.tzinfo
 54 print dt.date()
 55 print dt.time()
 56 print dt.replace(year = 2013)
 57 print dt.timetuple()
 58 print dt.utctimetuple()
 59 print dt.toordinal()
 60 print dt.weekday()
 61 print dt.isocalendar()
 62 #print dt.isoformat([sep])
 63 #datetime. ctime ():返回一个日期时间的C格式字符串,等效于time.ctime(time.mktime(dt.timetuple()));
 64  
 65  
 66 #3. 格式字符串
 67 # datetime. strftime (format)
 68 # %a 星期的简写。如 星期三为Web
 69 # %A 星期的全写。如 星期三为Wednesday
 70 # %b 月份的简写。如4月份为Apr
 71 # %B月份的全写。如4月份为April
 72 # %c:  日期时间的字符串表示。(如: 04/07/10 10:43:39)
 73 # %d:  日在这个月中的天数(是这个月的第几天)
 74 # %f:  微秒(范围[0,999999])
 75 # %H:  小时(24小时制,[0, 23])
 76 # %I:  小时(12小时制,[0, 11])
 77 # %j:  日在年中的天数 [001,366](是当年的第几天)
 78 # %m:  月份([01,12])
 79 # %M:  分钟([00,59])
 80 # %p:  AM或者PM
 81 # %S:  秒(范围为[00,61],为什么不是[00, 59],参考python手册~_~)
 82 # %U:  周在当年的周数当年的第几周),星期天作为周的第一天
 83 # %w:  今天在这周的天数,范围为[0, 6],6表示星期天
 84 # %W:  周在当年的周数(是当年的第几周),星期一作为周的第一天
 85 # %x:  日期字符串(如:04/07/10)
 86 # %X:  时间字符串(如:10:43:39)
 87 # %y:  2个数字表示的年份
 88 # %Y:  4个数字表示的年份
 89 # %z:  与utc时间的间隔 (如果是本地时间,返回空字符串)
 90 # %Z:  时区名称(如果是本地时间,返回空字符串)
 91 # %%:  %% => %
 92  
 93  
 94 dt = datetime.now()
 95 #print: (%Y-%m-%d %H:%M:%S %f):  2012-09-12 23:04:27 145000
 96 print '(%Y-%m-%d %H:%M:%S %f): ', dt.strftime('%Y-%m-%d %H:%M:%S %f')
 97 #print: (%Y-%m-%d %H:%M:%S %p):  12-09-12 11:04:27 PM
 98 print '(%Y-%m-%d %H:%M:%S %p): ', dt.strftime('%y-%m-%d %I:%M:%S %p')
 99 #print: %a: Wed
100 print '%%a: %s ' % dt.strftime('%a')
101 #print: %A: Wednesday
102 print '%%A: %s ' % dt.strftime('%A')
103 #print: %b: Sep
104 print '%%b: %s ' % dt.strftime('%b')
105 #print: %B: September
106 print '%%B: %s ' % dt.strftime('%B')
107 #print: 日期时间%c: 09/12/12 23:04:27
108 print '日期时间%%c: %s ' % dt.strftime('%c')
109 #print: 日期%x:09/12/12
110 print '日期%%x:%s ' % dt.strftime('%x')
111 #print: 时间%X:23:04:27
112 print '时间%%X:%s ' % dt.strftime('%X')
113 #print: 今天是这周的第3天
114 print '今天是这周的第%s天 ' % dt.strftime('%w')
115 #print: 今天是今年的第256天
116 print '今天是今年的第%s天 ' % dt.strftime('%j')
117 #print: 今周是今年的第37周
118 print '今周是今年的第%s周 ' % dt.strftime('%U')

4 hashlib

用于加密相关的操作,代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法

 

 1 import hashlib
 2 
 3 # ######## md5 ########
 4 
 5 hash = hashlib.md5()
 6 hash.update(bytes("admin",encoding="utf-8"))
 7 print(hash.hexdigest())
 8 
 9 # ######## sha1 ########
10 
11 hash = hashlib.sha1()
12 hash.update(bytes("admin",encoding="utf-8"))
13 print(hash.hexdigest())
14 
15 # ######## sha256 ########
16 
17 hash = hashlib.sha256()
18 hash.update(bytes("admin",encoding="utf-8"))
19 print(hash.hexdigest())
20 
21 # ######## sha384 ########
22 
23 hash = hashlib.sha384()
24 hash.update(bytes("admin",encoding="utf-8"))
25 print(hash.hexdigest())
26 
27 # ######## sha512 ########
28 
29 hash = hashlib.sha512()
30 hash.update(bytes("admin",encoding="utf-8"))
31 print(hash.hexdigest())

加盐

以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。

1 ######## md5 加盐########
2 
3 hash = hashlib.md5(bytes("salt;%#%salt",encoding="utf-8"))
4 
5 hash.update(bytes("admin",encoding="utf-8"))
6 print(hash.hexdigest())
1 obj = hashlib.md5(bytes("salt;%#%salt", encoding="utf-8"))  # 这里是输入的盐值  ##创建hash对象,md5:(message-Digest Algorithm 5)消息摘要算法,得出一个128位的密文
2 print(obj)  # <md5 HASH object @ 0x0000000000A1F800>
3 obj.update(bytes("mypasswd123", encoding="utf-8"))  # 更新哈希对象以字符串参数 其实就是你的明文密码
4 print(obj.digest())  ##返回摘要,作为二进制数据字符串值  b'\x04\x80)\x17\\\xf8dPA\xbc\xd9@e\xeb&\x0f'
5 print(obj.hexdigest())  # 返回十六进制数字字符串  048029175cf8645041bcd94065eb260f

HMAC加密:

python 还有一个 hmac 模块,它内部对我们创建 key 和 内容 再进行处理然后再加密 

消息认证算法:MAC (Message Authentication Codes)  消息认证码

1 import hmac
2 h = hmac.new('wupeiqi')
3 h.update('hellowo')
4 print h.hexdigest()
 1  对称加密:
 2         加密算法 + 口令
 3             明文 --> 密文
 4  
 5             字典攻击
 6  
 7             20位:100^20=10^32
 8  
 9             加密方,解密方使用同一个口令
10  
11             加密算法:
12                 DES:56位    2003 被电子边境委员会组织3个小时轻松破解所有des
13                 AES:128位  高级加密标准
14                 3DES:3次加密后的
15  
16             加密方,解密方使用同一个口令
17             DES(56bits), 3DES, AES(128bits), Blowfish
18             Twofish, IDEA, RC6, CAST5, Serpent
19  
20             block
21  
22             特性:1、加密/解密使用同一口令
23                   2、将原文分割成固定大小的数据块,对这些进行加密
24                       ECB, CBC
25 密钥交换(IKE: Internet Key Exchange):DH算法   发明者两个人的名字首字母
26  
27     非对称加密:  :本地生成一对钥匙,公钥私钥,公钥是可以公开的,私钥是自己的。跟别人通信,就把对方的公钥要过来,加密完,只有对方才能解开。
28         由于加密太长,所以不用来加密数据。用对称密码加密数据,用非对称密码的钥匙加密身份
29  
30         加密算法:RSA, EIGamal, DSA
31  
32         1、密钥交换
33         2、身份认证
34     单向加密:
35         抽取数据特征码:
36             MD5, SHA1, SHA512, CRC-32(循环冗余校验码)
37  
38         1、完整性
39  
40         消息认证算法:MAC (Message Authentication Codes)  消息认证码
41             CBC-MAC
42             HMAC:
43  
44             雪崩效应:
45             定长输入:
46  
47  
48  
49 数据加密: 抽取数据特征码用单向加密,再用非对称加密特征码,加在数据前面,然后在用对称加密,然后再用对方的公钥加密数据。发送出去。
加密介绍

注册 登陆案例

 1 import hashlib
 2 
 3 def md5(args):
 4     hs=hashlib.md5()
 5     hs.update(bytes(args,encoding="utf-8"))
 6     return hs.hexdigest()
 7 
 8 
 9 def register(us,pw):
10     with open("db","a",encoding="utf-8") as f:
11         temp=us+"|"+md5(pw)+"\n"
12         f.write(temp)
13 def login(us,pw):
14     with open("db","r",encoding="utf-8") as f:
15         for i in f:
16             u,p=i.strip().split("|")
17             if u==us and md5(pw)==p:
18                 return True
19 ch=int(input("1.登陆\n2.注册"))
20 if ch==2:
21     user=input("用户名:")
22     pwd=input("密码:")
23     register(user,pwd)
24 if ch==1:
25     user = input("用户名:")
26     pwd = input("密码:")
27     r=login(user,pwd)
28     if r:
29         print("登陆成功")
30     else:
31         print("登陆失败")
View Code

5 pickle 序列化 (等同json)

Python中用于序列化的两个模块

 

    •   json     用于【字符串】和 【python基本数据类型】 间进行转换
    •   pickle   用于【python特有的类型】 和 【python基本数据类型】间进行转换

 

  

  Json模块提供了四个功能:dumps、dump、loads、load

  pickle模块提供了四个功能:dumps、dump、loads、load

   

load loads dumps dump 区别

  我们看一下 pickle 接口。 pickle 模块提供了以下函数对: dumps(object) 返回一个字符串,它包含一个 pickle 格式的对象; loads(string) 返回包含在 pickle 字符串中的对象; dump(object, file) 将对象写到文件,这个文件可以是实际的物理文件,但也可以是任何类似于文件的对象,这个对象具有 write() 方法,可以接受单个的字符串参数; load(file) 返回包含在 pickle 文件中的对象。

 

dumps dump 区别 存入文件

accounts = {
1000: {
'name': 'Alex LI',
'email': 'lijie3721@126.com',
'passwd': 'abc123',
'balance': 15000,
'phone': 13651054608,
'bank_acc': {
'ICBC': 14324234,
'CBC': 235234,
'ABC': 35235423
}
},
1001: {
'name': 'CaiXin Guo',
'email': 'caixin@126.com',
'passwd': 'abc145323',
'balance': -15000,
'phone': 1345635345,
'bank_acc': {
'ICBC': 4334343,
}
},
}

import pickle

# dumps 直接传存储对象,也就是先转成制服穿在传进文件
# f = open("pickle_test.db", "wb")
# f.write(pickle.dumps(accounts))
# f.close()
#dump除了传存储对象还有打开的文件句柄,同事完成
f = open("pickle_test2.db", "wb")
pickle.dump(accounts, f)
f.close()

load loads 区别 这里注意文件指针 一次read 就到结尾

import pickle

# f = open("pickle_test.db", "rb")
#
# acc = pickle.loads(f.read())
# f.close()
# print(acc,type(acc))
f = open("pickle_test2.db", "rb")
acc_load = pickle.load(f)
print(acc_load)

加载到内存修改后再存入文件

import pickle
f = open("account.db","rb")
 
acc = pickle.loads(f.read())
f.close()
 
acc[1000]['balance'] -=500
 
f = open("account.db","wb")
f.write(pickle.dumps(acc))
f.close()
 
f = open("account.db","rb")
 
acc = pickle.loads(f.read())
print(acc)
f.close()

 

6 json 序列化

  首先我们应该知道,python的一些不是通用的数据类型json是不能序列话的,比如时间戳等

 

 loads 方法 将传过来的字符串(长得像python的字典或者列表数据类型)序列化成字典或列表

  注意其调用的对象内部必须是双引号,json不识别单引号,而且,整个字符串必须被单引号或者三个引号引起来,否则报错

 1 import json
 2 
 3 # s = "{'data':'invilad','status':'1000'}"  # json 认为里面必须是双引号才会处理,否则会报错,这样会报错
 4 s1='{"data":"invilad","status":"1000"}' # json 认为里面必须是双引号才会处理,否则会报错,不会报错
 5 s2="""{"data":"invilad","status":"1000"}""" # json 认为里面必须是双引号才会处理,否则会报错,不会报错
 6 l = "[1,2,3]"
 7 # ret = json.loads(s)  # loads 将形似python数据类型列表或字典的字符串转换成 列表或者字典
 8 ret2=json.loads(s1)
 9 ret3=json.loads(s2)
10 # print(ret, type(ret))
11 print(ret2,type(ret2))
12 print(ret3,type(ret3))

dumps 方法  将python数据类型列表或字典转换成形似列表或者字典的字符串

1 n = {'status': '1000', 'data': 'invilad'}
2 m = [1, 2, 3]
3 ret1 = json.dumps(n)  # dumps 将python数据类型列表或字典转换成形似列表或者字典的字符串
4 print(ret1,type(ret1))  # {"data": "invilad", "status": "1000"} <class 'str'>
5 ret1 = json.dumps(m)
6 print(ret1,type(ret1)) # [1, 2, 3] <class 'str'>

dump 和load 的用法

1 n = {'status': '1000', 'data': 'invilad'}
2 m = [1, 2, 3]
3 # json.dump(n,open("json_test",'w'))# dump 功能就是 先转换为字符串,再写入文件
4 r = json.load(open("json_test",'r'))# load 功能就是 读取文件字符串 并转化为python数据类型
5 print(r,type(r))

知识点2 :我们接收的网页请求过来是字符串或者字节

1 from urllib import request
2 
3 f = request.urlopen("http://www.cnblogs.com/") #获取网站内容,作为对象
4 # f = request.urlopen("http://yujuanfudan.blog.163.com/")
5 ret = f.read() #对象的read方法读出来,和文件类似
6 print(type(ret)) #初始是bytes类型
7 print(str(ret, encoding="utf-8")) #转成字符串类型

7 requests 第三方模块  

Python标准库中提供了:urllib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。

 

发送GET请求

1 import urllib.request
2 
3 
4 f = urllib.request.urlopen('http://www.webxml.com.cn//webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode=424662508')
5 result = f.read().decode('utf-8')
6 print(result)

发送携带请求头的GET请求

1 import urllib.request
2 
3 req = urllib.request.Request('http://www.example.com/')
4 req.add_header('Referer', 'http://www.python.org/')
5 r = urllib.request.urlopen(req)
6 
7 result = f.read().decode('utf-8')

注:更多见Python官方文档:https://docs.python.org/3.5/library/urllib.request.html#module-urllib.request

 

request模块

Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装,从而使得Pythoner进行网络请求时,变得美好了许多,使用Requests可以轻而易举的完成浏览器可有的任何操作。

1、安装模块

pip3 install requests

2、使用模块

1 import requests,json
2 res=requests.get("http://www.weather.com.cn/adat/sk/101010500.html")
3 res.encoding="utf-8"
4 result=res.text #通过text拿到一个字符串
5 print(result,type(result))
6 dic=json.loads(result) #通过json.loads转化成字典
7 print(dic,type(dic))

 

 1 # 1、无参数实例
 2  
 3 import requests
 4  
 5 ret = requests.get('https://github.com/timeline.json')
 6  
 7 print(ret.url)
 8 print(ret.text)
 9  
10  
11  
12 # 2、有参数实例
13  
14 import requests
15  
16 payload = {'key1': 'value1', 'key2': 'value2'}
17 ret = requests.get("http://httpbin.org/get", params=payload)
18  
19 print(ret.url)
20 print(ret.text)
21 
22 GET请求
GET请求
 1 # 1、基本POST实例
 2  
 3 import requests
 4  
 5 payload = {'key1': 'value1', 'key2': 'value2'}
 6 ret = requests.post("http://httpbin.org/post", data=payload)
 7  
 8 print(ret.text)
 9  
10  
11 # 2、发送请求头和数据实例
12  
13 import requests
14 import json
15  
16 url = 'https://api.github.com/some/endpoint'
17 payload = {'some': 'data'}
18 headers = {'content-type': 'application/json'}
19  
20 ret = requests.post(url, data=json.dumps(payload), headers=headers)
21  
22 print(ret.text)
23 print(ret.cookies)
24 
25 POST请求
POST请求
 1 requests.get(url, params=None, **kwargs)
 2 requests.post(url, data=None, json=None, **kwargs)
 3 requests.put(url, data=None, **kwargs)
 4 requests.head(url, **kwargs)
 5 requests.delete(url, **kwargs)
 6 requests.patch(url, data=None, **kwargs)
 7 requests.options(url, **kwargs)
 8  
 9 # 以上方法均是在此方法的基础上构建
10 requests.request(method, url, **kwargs)
11 
12 其他请求
其他请求

更多requests模块相关的文档见:http://cn.python-requests.org/zh_CN/latest/

3、Http请求和XML实例

实例:检测QQ账号是否在线

 1 import urllib
 2 import requests
 3 from xml.etree import ElementTree as ET
 4 
 5 # 使用内置模块urllib发送HTTP请求,或者XML格式内容
 6 """
 7 f = urllib.request.urlopen('http://www.webxml.com.cn//webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode=424662508')
 8 result = f.read().decode('utf-8')
 9 """
10 
11 
12 # 使用第三方模块requests发送HTTP请求,或者XML格式内容
13 r = requests.get('http://www.webxml.com.cn//webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode=424662508')
14 result = r.text
15 
16 # 解析XML格式内容
17 node = ET.XML(result)
18 
19 # 获取内容
20 if node.text == "Y":
21     print("在线")
22 else:
23     print("离线")
View Code

实例:查看火车停靠信息

 1 import urllib
 2 import requests
 3 from xml.etree import ElementTree as ET
 4 
 5 # 使用内置模块urllib发送HTTP请求,或者XML格式内容
 6 """
 7 f = urllib.request.urlopen('http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=G666&UserID=')
 8 result = f.read().decode('utf-8')
 9 """
10 
11 # 使用第三方模块requests发送HTTP请求,或者XML格式内容
12 r = requests.get('http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=G666&UserID=')
13 result = r.text
14 
15 # 解析XML格式内容
16 root = ET.XML(result)
17 for node in root.iter('TrainDetailInfo'):
18     print(node.find('TrainStation').text,node.find('StartTime').text,node.tag,node.attrib)
View Code

注:更多接口猛击这里

8 xml模块 

 

安装requests 模块

查看天气状况

1 import requests,json
2 res=requests.get("http://www.weather.com.cn/adat/sk/101010500.html")
3 res.encoding="utf-8"
4 result=res.text #通过text拿到一个字符串
5 print(result,type(result))
6 dic=json.loads(result) #通过json.loads转化成字典
7 print(dic,type(dic))

xml 讲解:

XML是实现不同语言或程序之间进行数据交换的协议,XML文件格式如下:

first.xml

 1 <data>
 2     <country name="Liechtenstein">
 3         <rank updated="yes">2</rank>
 4         <year>2023</year>
 5         <gdppc>141100</gdppc>
 6         <neighbor direction="E" name="Austria" />
 7         <neighbor direction="W" name="Switzerland" />
 8     </country>
 9     <country name="Singapore">
10         <rank updated="yes">5</rank>
11         <year>2026</year>
12         <gdppc>59900</gdppc>
13         <neighbor direction="N" name="Malaysia" />
14     </country>
15     <country name="Panama">
16         <rank updated="yes">69</rank>
17         <year>2026</year>
18         <gdppc>13600</gdppc>
19         <neighbor direction="W" name="Costa Rica" />
20         <neighbor direction="E" name="Colombia" />
21     </country>
22 </data>

 

 1 # 第一种,这种修改不了xml文件的内容
 2 # 循环获取多级节点 标签
 3 import requests
 4 from xml.etree import ElementTree as ET
 5 # f = open("first.xml","r",encoding="utf-8")
 6 # ret = ET.XML(f.read())
 7 #
 8 # for node in ret:
 9 #     print(node.find("rank").text) # find的查找值一定要是 有text的内容的标签
10 #
11 #     # for node_node in node:
12     #     for node__ in node_node:
13     #         print(node__.find("rank"))
14 # for node in ret.iter("country"):
15 #     print(node.find("year").text)
16 
17 课上代码

 

1、解析XML

利用ElementTree.XML将字符串解析成xml对象

 1 from xml.etree import ElementTree as ET
 2 
 3 
 4 # 打开文件,读取XML内容
 5 str_xml = open('xo.xml', 'r').read()
 6 
 7 # 将字符串解析成xml特殊对象,root代指xml文件的根节点
 8 root = ET.XML(str_xml)
 9 
10 利用ElementTree.XML将字符串解析成xml对象

 

#利用ElementTree.parse将文件直接解析成xml对象

1 from xml.etree import ElementTree as ET
2 
3 # 直接解析xml文件
4 tree = ET.parse("xo.xml")
5 
6 # 获取xml文件的根节点
7 root = tree.getroot()
8 
9 #利用ElementTree.parse将文件直接解析成xml对象

 

xml解析和保存的方式

 1 # 解析xml
 2     # 1 接口url 请求get获得的字符串类型 XML
 3             # import requests
 4             # from xml.etree import ElementTree as ET
 5             # r = requests.get("http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=K234&UserID=")
 6             # result = r.text
 7             # # 将 请求的字符串结果 通过xml的模块的方法转换成xml格式
 8             # ret = ET.XML(result)
 9             # ==============分隔符====如下是文件句柄 读取的字符串
10             # from xml.etree import ElementTree as ET
11             # f = open("first.xml","r",encoding="utf-8")
12             # ret = ET.XML(f.read())
13             #
14             # 对于 上面的这种 是Element对象,而不是ElementTree对象,因此不能够write到文件,但是
15             #我们可以 先创建ElementTree对象
16             # tree = ElementTree(ret) #将ret这个Element对象对应的内存的xml字符串 传给ElementTree类  做成ElementTree对象
17             # tree.write("new.xml")
18     # 2 文件类型的xml文档   parse
19             #from xml.etree import ElementTree as ET
20             # n = ET.parse("first.xml")
21             #
22             # ret = n.getroot()  # getroot方法拿到根节点
23 
24             # son = ET.Element("Biaoqian2",{"key":"value"})
25             # son.text="zhi"
26             # ele1 = ET.Element("qq",key2="value2", )
27             # ele1.text="woshizhi"
28             # ret.append(son)
29             # son.append(ele1)
30             # n.write("out2.xml")
31 
32 xml解析和保存的方式

 

2、操作XML

XML格式类型是节点嵌套节点,对于每一个节点均有以下功能,以便对当前节点进行操作:

  1 class Element:
  2     """An XML element.
  3 
  4     This class is the reference implementation of the Element interface.
  5 
  6     An element's length is its number of subelements.  That means if you
  7     want to check if an element is truly empty, you should check BOTH
  8     its length AND its text attribute.
  9 
 10     The element tag, attribute names, and attribute values can be either
 11     bytes or strings.
 12 
 13     *tag* is the element name.  *attrib* is an optional dictionary containing
 14     element attributes. *extra* are additional element attributes given as
 15     keyword arguments.
 16 
 17     Example form:
 18         <tag attrib>text<child/>...</tag>tail
 19 
 20     """
 21 
 22     当前节点的标签名
 23     tag = None
 24     """The element's name."""
 25 
 26     当前节点的属性
 27 
 28     attrib = None
 29     """Dictionary of the element's attributes."""
 30 
 31     当前节点的内容
 32     text = None
 33     """
 34     Text before first subelement. This is either a string or the value None.
 35     Note that if there is no text, this attribute may be either
 36     None or the empty string, depending on the parser.
 37 
 38     """
 39 
 40     tail = None
 41     """
 42     Text after this element's end tag, but before the next sibling element's
 43     start tag.  This is either a string or the value None.  Note that if there
 44     was no text, this attribute may be either None or an empty string,
 45     depending on the parser.
 46 
 47     """
 48 
 49     def __init__(self, tag, attrib={}, **extra):
 50         if not isinstance(attrib, dict):
 51             raise TypeError("attrib must be dict, not %s" % (
 52                 attrib.__class__.__name__,))
 53         attrib = attrib.copy()
 54         attrib.update(extra)
 55         self.tag = tag
 56         self.attrib = attrib
 57         self._children = []
 58 
 59     def __repr__(self):
 60         return "<%s %r at %#x>" % (self.__class__.__name__, self.tag, id(self))
 61 
 62     def makeelement(self, tag, attrib):
 63         创建一个新节点
 64         """Create a new element with the same type.
 65 
 66         *tag* is a string containing the element name.
 67         *attrib* is a dictionary containing the element attributes.
 68 
 69         Do not call this method, use the SubElement factory function instead.
 70 
 71         """
 72         return self.__class__(tag, attrib)
 73 
 74     def copy(self):
 75         """Return copy of current element.
 76 
 77         This creates a shallow copy. Subelements will be shared with the
 78         original tree.
 79 
 80         """
 81         elem = self.makeelement(self.tag, self.attrib)
 82         elem.text = self.text
 83         elem.tail = self.tail
 84         elem[:] = self
 85         return elem
 86 
 87     def __len__(self):
 88         return len(self._children)
 89 
 90     def __bool__(self):
 91         warnings.warn(
 92             "The behavior of this method will change in future versions.  "
 93             "Use specific 'len(elem)' or 'elem is not None' test instead.",
 94             FutureWarning, stacklevel=2
 95             )
 96         return len(self._children) != 0 # emulate old behaviour, for now
 97 
 98     def __getitem__(self, index):
 99         return self._children[index]
100 
101     def __setitem__(self, index, element):
102         # if isinstance(index, slice):
103         #     for elt in element:
104         #         assert iselement(elt)
105         # else:
106         #     assert iselement(element)
107         self._children[index] = element
108 
109     def __delitem__(self, index):
110         del self._children[index]
111 
112     def append(self, subelement):
113         为当前节点追加一个子节点
114         """Add *subelement* to the end of this element.
115 
116         The new element will appear in document order after the last existing
117         subelement (or directly after the text, if it's the first subelement),
118         but before the end tag for this element.
119 
120         """
121         self._assert_is_element(subelement)
122         self._children.append(subelement)
123 
124     def extend(self, elements):
125         为当前节点扩展 n 个子节点
126         """Append subelements from a sequence.
127 
128         *elements* is a sequence with zero or more elements.
129 
130         """
131         for element in elements:
132             self._assert_is_element(element)
133         self._children.extend(elements)
134 
135     def insert(self, index, subelement):
136         在当前节点的子节点中插入某个节点,即:为当前节点创建子节点,然后插入指定位置
137         """Insert *subelement* at position *index*."""
138         self._assert_is_element(subelement)
139         self._children.insert(index, subelement)
140 
141     def _assert_is_element(self, e):
142         # Need to refer to the actual Python implementation, not the
143         # shadowing C implementation.
144         if not isinstance(e, _Element_Py):
145             raise TypeError('expected an Element, not %s' % type(e).__name__)
146 
147     def remove(self, subelement):
148         在当前节点在子节点中删除某个节点
149         """Remove matching subelement.
150 
151         Unlike the find methods, this method compares elements based on
152         identity, NOT ON tag value or contents.  To remove subelements by
153         other means, the easiest way is to use a list comprehension to
154         select what elements to keep, and then use slice assignment to update
155         the parent element.
156 
157         ValueError is raised if a matching element could not be found.
158 
159         """
160         # assert iselement(element)
161         self._children.remove(subelement)
162 
163     def getchildren(self):
164         获取所有的子节点(废弃)
165         """(Deprecated) Return all subelements.
166 
167         Elements are returned in document order.
168 
169         """
170         warnings.warn(
171             "This method will be removed in future versions.  "
172             "Use 'list(elem)' or iteration over elem instead.",
173             DeprecationWarning, stacklevel=2
174             )
175         return self._children
176 
177     def find(self, path, namespaces=None):
178         获取第一个寻找到的子节点
179         """Find first matching element by tag name or path.
180 
181         *path* is a string having either an element tag or an XPath,
182         *namespaces* is an optional mapping from namespace prefix to full name.
183 
184         Return the first matching element, or None if no element was found.
185 
186         """
187         return ElementPath.find(self, path, namespaces)
188 
189     def findtext(self, path, default=None, namespaces=None):
190         获取第一个寻找到的子节点的内容
191         """Find text for first matching element by tag name or path.
192 
193         *path* is a string having either an element tag or an XPath,
194         *default* is the value to return if the element was not found,
195         *namespaces* is an optional mapping from namespace prefix to full name.
196 
197         Return text content of first matching element, or default value if
198         none was found.  Note that if an element is found having no text
199         content, the empty string is returned.
200 
201         """
202         return ElementPath.findtext(self, path, default, namespaces)
203 
204     def findall(self, path, namespaces=None):
205         获取所有的子节点
206         """Find all matching subelements by tag name or path.
207 
208         *path* is a string having either an element tag or an XPath,
209         *namespaces* is an optional mapping from namespace prefix to full name.
210 
211         Returns list containing all matching elements in document order.
212 
213         """
214         return ElementPath.findall(self, path, namespaces)
215 
216     def iterfind(self, path, namespaces=None):
217         获取所有指定的节点,并创建一个迭代器(可以被for循环)
218         """Find all matching subelements by tag name or path.
219 
220         *path* is a string having either an element tag or an XPath,
221         *namespaces* is an optional mapping from namespace prefix to full name.
222 
223         Return an iterable yielding all matching elements in document order.
224 
225         """
226         return ElementPath.iterfind(self, path, namespaces)
227 
228     def clear(self):
229         清空节点
230         """Reset element.
231 
232         This function removes all subelements, clears all attributes, and sets
233         the text and tail attributes to None.
234 
235         """
236         self.attrib.clear()
237         self._children = []
238         self.text = self.tail = None
239 
240     def get(self, key, default=None):
241         获取当前节点的属性值
242         """Get element attribute.
243 
244         Equivalent to attrib.get, but some implementations may handle this a
245         bit more efficiently.  *key* is what attribute to look for, and
246         *default* is what to return if the attribute was not found.
247 
248         Returns a string containing the attribute value, or the default if
249         attribute was not found.
250 
251         """
252         return self.attrib.get(key, default)
253 
254     def set(self, key, value):
255         为当前节点设置属性值
256         """Set element attribute.
257 
258         Equivalent to attrib[key] = value, but some implementations may handle
259         this a bit more efficiently.  *key* is what attribute to set, and
260         *value* is the attribute value to set it to.
261 
262         """
263         self.attrib[key] = value
264 
265     def keys(self):
266         获取当前节点的所有属性的 key
267 
268         """Get list of attribute names.
269 
270         Names are returned in an arbitrary order, just like an ordinary
271         Python dict.  Equivalent to attrib.keys()
272 
273         """
274         return self.attrib.keys()
275 
276     def items(self):
277         获取当前节点的所有属性值,每个属性都是一个键值对
278         """Get element attributes as a sequence.
279 
280         The attributes are returned in arbitrary order.  Equivalent to
281         attrib.items().
282 
283         Return a list of (name, value) tuples.
284 
285         """
286         return self.attrib.items()
287 
288     def iter(self, tag=None):
289         在当前节点的子孙中根据节点名称寻找所有指定的节点,并返回一个迭代器(可以被for循环)。
290         """Create tree iterator.
291 
292         The iterator loops over the element and all subelements in document
293         order, returning all elements with a matching tag.
294 
295         If the tree structure is modified during iteration, new or removed
296         elements may or may not be included.  To get a stable set, use the
297         list() function on the iterator, and loop over the resulting list.
298 
299         *tag* is what tags to look for (default is to return all elements)
300 
301         Return an iterator containing all the matching elements.
302 
303         """
304         if tag == "*":
305             tag = None
306         if tag is None or self.tag == tag:
307             yield self
308         for e in self._children:
309             yield from e.iter(tag)
310 
311     # compatibility
312     def getiterator(self, tag=None):
313         # Change for a DeprecationWarning in 1.4
314         warnings.warn(
315             "This method will be removed in future versions.  "
316             "Use 'elem.iter()' or 'list(elem.iter())' instead.",
317             PendingDeprecationWarning, stacklevel=2
318         )
319         return list(self.iter(tag))
320 
321     def itertext(self):
322         在当前节点的子孙中根据节点名称寻找所有指定的节点的内容,并返回一个迭代器(可以被for循环)。
323         """Create text iterator.
324 
325         The iterator loops over the element and all subelements in document
326         order, returning all inner text.
327 
328         """
329         tag = self.tag
330         if not isinstance(tag, str) and tag is not None:
331             return
332         if self.text:
333             yield self.text
334         for e in self:
335             yield from e.itertext()
336             if e.tail:
337                 yield e.tail
338 
339 节点功能一览表

 

由于 每个节点 都具有以上的方法,并且在上一步骤中解析时均得到了root(xml文件的根节点),so   可以利用以上方法进行操作xml文件。

解析文件方法

  1 先open文件获得文件句柄 ,然后通过ElementTree.XML方法

  2 ElementTree.parse(file_name)

a. 遍历XML文档的所有内容

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析方式一 ############
 4 """
 5 # 打开文件,读取XML内容
 6 str_xml = open('xo.xml', 'r').read()
 7 
 8 # 将字符串解析成xml特殊对象,root代指xml文件的根节点
 9 root = ET.XML(str_xml)
10 """
11 ############ 解析方式二 ############
12 
13 # 直接解析xml文件
14 tree = ET.parse("xo.xml")
15 
16 # 获取xml文件的根节点
17 root = tree.getroot()
18 
19 
20 ### 操作
21 
22 # 顶层标签
23 print(root.tag)
24 
25 
26 # 遍历XML文档的第二层
27 for child in root:
28     # 第二层节点的标签名称和标签属性
29     print(child.tag, child.attrib)
30     # 遍历XML文档的第三层
31     for i in child:
32         # 第二层节点的标签名称和内容
33         print(i.tag,i.text)

b、遍历XML中指定的节点

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析方式一 ############
 4 """
 5 # 打开文件,读取XML内容
 6 str_xml = open('xo.xml', 'r').read()
 7 
 8 # 将字符串解析成xml特殊对象,root代指xml文件的根节点
 9 root = ET.XML(str_xml)
10 """
11 ############ 解析方式二 ############
12 
13 # 直接解析xml文件
14 tree = ET.parse("xo.xml")
15 
16 # 获取xml文件的根节点
17 root = tree.getroot()
18 
19 
20 ### 操作
21 
22 # 顶层标签
23 print(root.tag)
24 
25 
26 # 遍历XML中所有的year节点
27 for node in root.iter('year'):
28     # 节点的标签名称和内容
29     print(node.tag, node.text)

c、修改节点内容

由于修改的节点时,均是在内存中进行,其不会影响文件中的内容。所以,如果想要修改,则需要重新将内存中的内容写到文件。

1  解析字符串方式,修改,保存

以open文件句柄方式打开文件并解析的文件,要最后生成ElementTree对象才能write

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析方式一 ############
 4 
 5 # 打开文件,读取XML内容
 6 str_xml = open('xo.xml', 'r').read()
 7 
 8 # 将字符串解析成xml特殊对象,root代指xml文件的根节点
 9 root = ET.XML(str_xml)
10 
11 ############ 操作 ############
12 
13 # 顶层标签
14 print(root.tag)
15 
16 # 循环所有的year节点
17 for node in root.iter('year'):
18     # 将year节点中的内容自增一
19     new_year = int(node.text) + 1
20     node.text = str(new_year)
21 
22     # 设置属性
23     node.set('name', 'alex')
24     node.set('age', '18')
25     # 删除属性
26     del node.attrib['name']
27 
28 
29 ############ 保存文件 ############
30 因为root是ElementTree.Element对象,没有write方法,只有ElementTree有write方法,可以将root对应的内存地址内容传给ElementTree,实例化成ElementTree对象,就有write方法了
31 
32 
33 tree = ET.ElementTree(root)
34 tree.write("newnew.xml", encoding='utf-8') #如果更改内容有中文就需要指定编码了

2  解析文件方式,修改,保存

而以parse打开的文件,就是ElementTree对象,就有write方法

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析方式二 ############
 4 
 5 # 直接解析xml文件
 6 tree = ET.parse("xo.xml")
 7 
 8 # 获取xml文件的根节点
 9 root = tree.getroot()
10 
11 ############ 操作 ############
12 
13 # 顶层标签
14 print(root.tag)
15 
16 # 循环所有的year节点
17 for node in root.iter('year'):
18     # 将year节点中的内容自增一
19     new_year = int(node.text) + 1
20     node.text = str(new_year)
21 
22     # 设置属性
23     node.set('name', 'alex')
24     node.set('age', '18')
25     # 删除属性
26     del node.attrib['name']
27 
28 
29 ############ 保存文件 ############
30 tree.write("newnew.xml", encoding='utf-8')

d、删除节点  

1 解析字符串方式打开,删除,保存

Element对象的remove方法 以 open方式打开如何保存

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析字符串方式打开 ############
 4 
 5 # 打开文件,读取XML内容
 6 str_xml = open('xo.xml', 'r').read()
 7 
 8 # 将字符串解析成xml特殊对象,root代指xml文件的根节点
 9 root = ET.XML(str_xml)
10 
11 ############ 操作 ############
12 
13 # 顶层标签
14 print(root.tag)
15 
16 # 遍历data下的所有country节点
17 for country in root.findall('country'):
18     # 获取每一个country节点下rank节点的内容
19     rank = int(country.find('rank').text)
20 
21     if rank > 50:
22         # 删除指定country节点
23         root.remove(country)
24 
25 ############ 保存文件 ############
26 tree = ET.ElementTree(root)
27 tree.write("newnew.xml", encoding='utf-8')
28 
29 Element对象的remove方法 以 open方式打开如何保存

2 解析文件方式打开,删除,保存

Element对象 remove 方法 以parse方法打开xml文件保存方法

 1 from xml.etree import ElementTree as ET
 2 
 3 ############ 解析文件方式 ############
 4 
 5 # 直接解析xml文件
 6 tree = ET.parse("xo.xml")
 7 
 8 # 获取xml文件的根节点
 9 root = tree.getroot()
10 
11 ############ 操作 ############
12 
13 # 顶层标签
14 print(root.tag)
15 
16 # 遍历data下的所有country节点
17 for country in root.findall('country'):
18     # 获取每一个country节点下rank节点的内容
19     rank = int(country.find('rank').text)
20 
21     if rank > 50:
22         # 删除指定country节点
23         root.remove(country)
24 
25 ############ 保存文件 ############
26 tree.write("newnew.xml", encoding='utf-8')
27 
28 Element对象 remove 方法 以parse方法打开xml文件保存方法

3、创建XML文档  

    类型str 等类 创建字符串有两种方式生成  a = 'name'  a = str("name")

创建方式(一)  类 Element(标签,{属性:值})

 1 from xml.etree import ElementTree as ET
 2 
 3 
 4 # 创建根节点
 5 root = ET.Element("famliy")
 6 
 7 
 8 # 创建节点大儿子
 9 son1 = ET.Element('son', {'name': '儿1'})
10 # 创建小儿子
11 son2 = ET.Element('son', {"name": '儿2'})
12 
13 # 在大儿子中创建两个孙子
14 grandson1 = ET.Element('grandson', {'name': '儿11'})
15 grandson2 = ET.Element('grandson', {'name': '儿12'})
16 son1.append(grandson1)
17 son1.append(grandson2)
18 
19 
20 # 把儿子添加到根节点中
21 root.append(son1)
22 root.append(son1)
23 
24 tree = ET.ElementTree(root)
25 tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)
26 
27 Element 创建xml方式
Element 创建xml方式
 1 #!/usr/bin/env python
 2 # _*_ coding:utf-8 _*_
 3 __author__ = 'liujianzuo'
 4 
 5 from xml.etree import ElementTree as ET
 6 tree = ET.parse("first.xml")  # 直接解析xml格式文件
 7 
 8 root = tree.getroot() #利用getroot方法获取根节点
 9 # print(root.tag)
10 # print(root.attrib)
11 # print(root.text)
12 
13 # 同 字符串创建的两种方式来看 xml也有两种方式创建
14 #2 利用 Element类直接创建  ======
15 son = ET.Element("Biaoqian2",{"key":"value"})
16 son.text="zhi"
17 ele1 = ET.Element("qq",key2="value2", )
18 ele1.text="woshizhi"
19 root.append(son)
20 son.append(ele1)
21 tree.write("out2.xml")
22 
23 在已有文件获取根节点情况 利用Element创建 二级三级节点
在已有文件获取根节点情况 利用Element创建 二级三级节点

创建方式(二)

 1 from xml.etree import ElementTree as ET
 2 
 3 # 创建根节点
 4 root = ET.Element("famliy")
 5 
 6 
 7 # 创建大儿子
 8 # son1 = ET.Element('son', {'name': '儿1'})
 9 son1 = root.makeelement('son', {'name': '儿1'})
10 # 创建小儿子
11 # son2 = ET.Element('son', {"name": '儿2'})
12 son2 = root.makeelement('son', {"name": '儿2'})
13 
14 # 在大儿子中创建两个孙子
15 # grandson1 = ET.Element('grandson', {'name': '儿11'})
16 grandson1 = son1.makeelement('grandson', {'name': '儿11'})
17 # grandson2 = ET.Element('grandson', {'name': '儿12'})
18 grandson2 = son1.makeelement('grandson', {'name': '儿12'})
19 
20 son1.append(grandson1)
21 son1.append(grandson2)
22 
23 
24 # 把儿子添加到根节点中
25 root.append(son1)
26 root.append(son1)
27 
28 tree = ET.ElementTree(root)
29 tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)
30 
31 利用 makeelement创建 Element类的对象 创建一个新文件
利用 makeelement创建 Element类的对象 创建一个新文件
 1 from xml.etree import ElementTree as ET
 2 tree = ET.parse("first.xml")  # 直接解析xml格式文件
 3 
 4 root = tree.getroot() #利用getroot方法获取根节点
 5 print(root.tag)
 6 print(root.attrib)
 7 print(root.text)
 8 
 9 # 同 字符串创建的两种方式来看 xml也有两种方式创建
10 # 
11 # 1 利用 makeelement创建 Element类的对象  =====
12 son = root.makeelement("biaoqian",{"key":"value"})
13 
14 s = son.makeelement("biaoqian2",{"key2":"value"})  #Element类的对象
15 
16 son.append(s) #传入根的儿子的儿子
17 root.append(son)  # 传入根节点下,作为儿子
18 
19 tree.write("out.xml")
20 
21 已有文件first.xml 利用 makeelement创建 Element类的对象
已有文件first.xml 利用 makeelement创建 Element类的对象

创建方式(三)

 1 from xml.etree import ElementTree as ET
 2 
 3 
 4 # 创建根节点
 5 root = ET.Element("famliy")
 6 
 7 
 8 # 创建节点大儿子
 9 son1 = ET.SubElement(root, "son", attrib={'name': '儿1'})
10 # 创建小儿子
11 son2 = ET.SubElement(root, "son", attrib={"name": "儿2"})
12 
13 # 在大儿子中创建一个孙子
14 grandson1 = ET.SubElement(son1, "age", attrib={'name': '儿11'})
15 grandson1.text = '孙子'
16 
17 
18 et = ET.ElementTree(root)  #生成文档对象
19 et.write("test.xml", encoding="utf-8", xml_declaration=True, short_empty_elements=False)
20 
21 SubElement创建
SubElement创建

将生成的xml的标签加缩进后写入新文件

由于原生保存的XML时默认无缩进,如果想要设置缩进的话, 需要修改保存方式:

 1 from xml.etree import ElementTree as ET
 2 from xml.dom import minidom
 3 
 4 
 5 def prettify(elem):
 6     """将节点转换成字符串,并添加缩进。
 7     """
 8     rough_string = ET.tostring(elem, 'utf-8')
 9     reparsed = minidom.parseString(rough_string)
10     return reparsed.toprettyxml(indent="\t")
11 
12 # 创建根节点
13 root = ET.Element("famliy")
14 
15 
16 # 创建大儿子
17 # son1 = ET.Element('son', {'name': '儿1'})
18 son1 = root.makeelement('son', {'name': '儿1'})
19 # 创建小儿子
20 # son2 = ET.Element('son', {"name": '儿2'})
21 son2 = root.makeelement('son', {"name": '儿2'})
22 
23 # 在大儿子中创建两个孙子
24 # grandson1 = ET.Element('grandson', {'name': '儿11'})
25 grandson1 = son1.makeelement('grandson', {'name': '儿11'})
26 # grandson2 = ET.Element('grandson', {'name': '儿12'})
27 grandson2 = son1.makeelement('grandson', {'name': '儿12'})
28 
29 son1.append(grandson1)
30 son1.append(grandson2)
31 
32 
33 # 把儿子添加到根节点中
34 root.append(son1)
35 root.append(son1)
36 
37 
38 raw_str = prettify(root)
39 
40 f = open("xxxoo.xml",'w',encoding='utf-8')
41 f.write(raw_str)
42 f.close()
43 
44 Element 生成根 各节点 并传入给处理标签的函数,并将返回对象写入文件
Element 生成根 各节点 并传入给处理标签的函数,并将返回对象写入文件

函数封装了 缩进和写入文件的功能

 1 from xml.etree import ElementTree as ET
 2 from xml.dom import minidom
 3 
 4 def MyWrite(root, file_path):
 5 
 6     rough_string = ET.tostring(root, 'utf-8')
 7     reparsed = minidom.parseString(rough_string)
 8     new_str = reparsed.toprettyxml(indent="\t")
 9     f = open(file_path, 'w', encoding='utf-8')
10     f.write(new_str)
11     f.close()
12 
13 root = ET.Element('family', {"age": "18"})
14 
15 # son = ET.Element('family', {"age": "18"})
16 # son = root.makeelement('family', {"age": "18"})
17 # root.append(son)
18 ET.SubElement(root,'family', {"age": "19"})
19 son = ET.SubElement(root,'family', {"age": "十一"})
20 ET.SubElement(son,'family', {"age": "1"})
21 
22 # tree = ET.ElementTree(root)
23 # tree.write("out.xml", encoding='utf-8', short_empty_elements=False)
24 # tree.write("out.xml", encoding='utf-8', xml_declaration=True)
25 # ET.tostring()
26 
27 MyWrite(root, "nnnnn.xml")
28 
29 传入 xml对象 和文件
传入 xml对象 和文件

 

4、命名空间

详细介绍,猛击这里

 1 from xml.etree import ElementTree as ET
 2 
 3 ET.register_namespace('com',"http://www.company.com") #some name
 4 
 5 # build a tree structure
 6 root = ET.Element("{http://www.company.com}STUFF")
 7 body = ET.SubElement(root, "{http://www.company.com}MORE_STUFF", attrib={"{http://www.company.com}hhh": "123"})
 8 body.text = "STUFF EVERYWHERE!"
 9 
10 # wrap it in an ElementTree instance, and save as XML
11 tree = ET.ElementTree(root)
12 
13 tree.write("page.xml",
14            xml_declaration=True,
15            encoding='utf-8',
16            method="xml")
17 
18 命名空间
View Code

练习

1 xml 获取qq是否在线 

1 http://www.webxml.com.cn//webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode=627904863
 1 import requests
 2 from xml.etree import ElementTree as ET #XML 模块
 3 req = requests.get("http://www.webxml.com.cn//webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode=1003408567")
 4 res = req.text #获取get到的字符串,用.text方法
 5 
 6 #解析xml格式内容
 7 #xml接受一个参数:字符串,格式化为特殊的对象
 8 node = ET.XML(res)
 9 if node.text == "Y":
10     print("在线")
11 elif node.text == "N":
12     print("离线")
13 elif node.text == "V":
14     print("隐身")

2 获取列车时刻表 xml 

  1 <DataSet xmlns="http://WebXml.com.cn/">
  2 <xs:schema xmlns="" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:msdata="urn:schemas-microsoft-com:xml-msdata" id="getDetailInfo">
  3 <xs:element name="getDetailInfo" msdata:IsDataSet="true" msdata:UseCurrentLocale="true">
  4 <xs:complexType>
  5 <xs:choice minOccurs="0" maxOccurs="unbounded">
  6 <xs:element name="TrainDetailInfo">
  7 <xs:complexType>
  8 <xs:sequence>
  9 <xs:element name="TrainStation" type="xs:string" minOccurs="0"/>
 10 <xs:element name="ArriveTime" type="xs:string" minOccurs="0"/>
 11 <xs:element name="StartTime" type="xs:string" minOccurs="0"/>
 12 <xs:element name="KM" type="xs:short" minOccurs="0"/>
 13 </xs:sequence>
 14 </xs:complexType>
 15 </xs:element>
 16 </xs:choice>
 17 </xs:complexType>
 18 </xs:element>
 19 </xs:schema>
 20 <diffgr:diffgram xmlns:msdata="urn:schemas-microsoft-com:xml-msdata" xmlns:diffgr="urn:schemas-microsoft-com:xml-diffgram-v1">
 21 <getDetailInfo xmlns="">
 22 <TrainDetailInfo diffgr:id="TrainDetailInfo1" msdata:rowOrder="0" diffgr:hasChanges="inserted">
 23 <TrainStation>上海(车次:K234\K235)</TrainStation>
 24 <ArriveTime/>
 25 <StartTime>11:12:00</StartTime>
 26 <KM>0</KM>
 27 </TrainDetailInfo>
 28 <TrainDetailInfo diffgr:id="TrainDetailInfo2" msdata:rowOrder="1" diffgr:hasChanges="inserted">
 29 <TrainStation>昆山</TrainStation>
 30 <ArriveTime>11:45:00</ArriveTime>
 31 <StartTime>11:48:00</StartTime>
 32 <KM>49</KM>
 33 </TrainDetailInfo>
 34 <TrainDetailInfo diffgr:id="TrainDetailInfo3" msdata:rowOrder="2" diffgr:hasChanges="inserted">
 35 <TrainStation>苏州</TrainStation>
 36 <ArriveTime>12:12:00</ArriveTime>
 37 <StartTime>12:16:00</StartTime>
 38 <KM>84</KM>
 39 </TrainDetailInfo>
 40 <TrainDetailInfo diffgr:id="TrainDetailInfo4" msdata:rowOrder="3" diffgr:hasChanges="inserted">
 41 <TrainStation>无锡</TrainStation>
 42 <ArriveTime>12:44:00</ArriveTime>
 43 <StartTime>12:55:00</StartTime>
 44 <KM>126</KM>
 45 </TrainDetailInfo>
 46 <TrainDetailInfo diffgr:id="TrainDetailInfo5" msdata:rowOrder="4" diffgr:hasChanges="inserted">
 47 <TrainStation>常州</TrainStation>
 48 <ArriveTime>13:22:00</ArriveTime>
 49 <StartTime>13:26:00</StartTime>
 50 <KM>165</KM>
 51 </TrainDetailInfo>
 52 <TrainDetailInfo diffgr:id="TrainDetailInfo6" msdata:rowOrder="5" diffgr:hasChanges="inserted">
 53 <TrainStation>镇江</TrainStation>
 54 <ArriveTime>14:13:00</ArriveTime>
 55 <StartTime>14:16:00</StartTime>
 56 <KM>237</KM>
 57 </TrainDetailInfo>
 58 <TrainDetailInfo diffgr:id="TrainDetailInfo7" msdata:rowOrder="6" diffgr:hasChanges="inserted">
 59 <TrainStation>南京</TrainStation>
 60 <ArriveTime>15:04:00</ArriveTime>
 61 <StartTime>15:16:00</StartTime>
 62 <KM>301</KM>
 63 </TrainDetailInfo>
 64 <TrainDetailInfo diffgr:id="TrainDetailInfo8" msdata:rowOrder="7" diffgr:hasChanges="inserted">
 65 <TrainStation>蚌埠</TrainStation>
 66 <ArriveTime>17:27:00</ArriveTime>
 67 <StartTime>17:50:00</StartTime>
 68 <KM>485</KM>
 69 </TrainDetailInfo>
 70 <TrainDetailInfo diffgr:id="TrainDetailInfo9" msdata:rowOrder="8" diffgr:hasChanges="inserted">
 71 <TrainStation>徐州</TrainStation>
 72 <ArriveTime>19:38:00</ArriveTime>
 73 <StartTime>19:58:00</StartTime>
 74 <KM>649</KM>
 75 </TrainDetailInfo>
 76 <TrainDetailInfo diffgr:id="TrainDetailInfo10" msdata:rowOrder="9" diffgr:hasChanges="inserted">
 77 <TrainStation>商丘</TrainStation>
 78 <ArriveTime>22:12:00</ArriveTime>
 79 <StartTime>22:17:00</StartTime>
 80 <KM>795</KM>
 81 </TrainDetailInfo>
 82 <TrainDetailInfo diffgr:id="TrainDetailInfo11" msdata:rowOrder="10" diffgr:hasChanges="inserted">
 83 <TrainStation>开封</TrainStation>
 84 <ArriveTime>23:49:00</ArriveTime>
 85 <StartTime>23:53:00</StartTime>
 86 <KM>926</KM>
 87 </TrainDetailInfo>
 88 <TrainDetailInfo diffgr:id="TrainDetailInfo12" msdata:rowOrder="11" diffgr:hasChanges="inserted">
 89 <TrainStation>郑州</TrainStation>
 90 <ArriveTime>00:37:00</ArriveTime>
 91 <StartTime>01:14:00</StartTime>
 92 <KM>998</KM>
 93 </TrainDetailInfo>
 94 <TrainDetailInfo diffgr:id="TrainDetailInfo13" msdata:rowOrder="12" diffgr:hasChanges="inserted">
 95 <TrainStation>新乡</TrainStation>
 96 <ArriveTime>02:20:00</ArriveTime>
 97 <StartTime>02:22:00</StartTime>
 98 <KM>1078</KM>
 99 </TrainDetailInfo>
100 <TrainDetailInfo diffgr:id="TrainDetailInfo14" msdata:rowOrder="13" diffgr:hasChanges="inserted">
101 <TrainStation>鹤壁</TrainStation>
102 <ArriveTime>03:01:00</ArriveTime>
103 <StartTime>03:03:00</StartTime>
104 <KM>1144</KM>
105 </TrainDetailInfo>
106 <TrainDetailInfo diffgr:id="TrainDetailInfo15" msdata:rowOrder="14" diffgr:hasChanges="inserted">
107 <TrainStation>安阳</TrainStation>
108 <ArriveTime>03:33:00</ArriveTime>
109 <StartTime>03:36:00</StartTime>
110 <KM>1185</KM>
111 </TrainDetailInfo>
112 <TrainDetailInfo diffgr:id="TrainDetailInfo16" msdata:rowOrder="15" diffgr:hasChanges="inserted">
113 <TrainStation>邯郸</TrainStation>
114 <ArriveTime>04:11:00</ArriveTime>
115 <StartTime>04:16:00</StartTime>
116 <KM>1245</KM>
117 </TrainDetailInfo>
118 <TrainDetailInfo diffgr:id="TrainDetailInfo17" msdata:rowOrder="16" diffgr:hasChanges="inserted">
119 <TrainStation>邢台</TrainStation>
120 <ArriveTime>04:47:00</ArriveTime>
121 <StartTime>04:51:00</StartTime>
122 <KM>1297</KM>
123 </TrainDetailInfo>
124 <TrainDetailInfo diffgr:id="TrainDetailInfo18" msdata:rowOrder="17" diffgr:hasChanges="inserted">
125 <TrainStation>石家庄</TrainStation>
126 <ArriveTime>06:05:00</ArriveTime>
127 <StartTime/>
128 <KM>1406</KM>
129 </TrainDetailInfo>
130 </getDetailInfo>
131 </diffgr:diffgram>
132 </DataSet>
133 
134 列车时刻表
XML文件
 1 # 获取 列车时刻表
 2 import requests
 3 from xml.etree import ElementTree as ET
 4 # 使用第三方模块requests 发送HTTP请求,或者XML 格式内容
 5 r = requests.get("http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=K234&UserID=")
 6 result = r.text
 7 
 8 # 将 请求的字符串结果 通过xml的模块的方法转换成xml格式
 9 ret = ET.XML(result)
10 
11 for node in ret.iter("TrainDetailInfo"): # xml的iter是可迭代的 传参是 xml的标签的名
12     # print(node.tag,node.attrib) # tag是标签
13     # if not node.find("StartTime").text: # find 是查找标签内的文本的标签对应的内容
14         # node.find("StartTime").text = "都到站了,管它几点呢,晚点你也得坐啊"
15     print(node.find("TrainStation").text,node.find("StartTime").text)
16 
17 完整查看xml列车时刻的代码
 1 import requests
 2 from xml.etree import ElementTree as ET
 3 
 4 # 使用第三方模块requests发送HTTP请求,或者XML格式内容
 5 url="http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode="
 6 tr=input("请输入列车号:")
 7 url=url+tr+"&UserID="
 8 req = requests.get(url)
 9 print(type(req))
10 res = req.text #获取get到的字符串
11 
12 #解析XML格式内容,把字符串解析成xml。
13 root=ET.XML(res)
14 for node in root.iter("TrainDetailInfo"):
15     # print(node.tag,node.attrib)
16     print(node.find("TrainStation").text,node.find("StartTime").text)

 

posted @ 2017-03-27 10:01  崔崔0624  阅读(897)  评论(0编辑  收藏  举报
TOP