04-03 模块 11-15
______egon新书python全套来袭请看:https://egonlin.com/book.html
11.用Python匹配HTMLtag的时候,<.*>
和<.*?>
有什么区别?
<.*>:贪婪匹配,会匹配到符合条件的所有标签
<.*?>:非贪婪匹配,匹配到符合条件的第一个标签
12.如何判断一个邮箱合法
import re
if re.match(r'^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$', email):
print('right')
else:
print('wrong')
13.sys.path.append("/root/mods")的作用?
将/root/mods文件添加到环境变量
14.下面那些是Python开发网络应用的框架
1. Django
2. Yii
3. Struts
4. Rails
5. Uliweb
6. CodeIgniter
7. gevent
8. Flask
9. web2py
10. Pylons
11. Tornado
12. Twisted
13. TurboGears
1,8,9,11,12,13
15.写Python爬虫都用到了那些模块,分别是做什么用的?
requests:请求库
BeautifulSoup:解析库
selenium:自动化测试工具
pyquery:网页解析库
pymysql:存储库。操作mysql数据库的
pymongo:操作mongodb数据库的
urllib.request 请求模块 模拟浏览器
urllib.error 异常处理模块
urllib.parse url解析模块 工具模块,如:拆分、合并
urllib.robotparser robots.txt 解析模块