摘要: https://www.taobao.com/ #CrowTaobaoPrice.py import requests import re def getHTMLText(url):#获得网页信息 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 1 阅读全文
posted @ 2020-07-09 17:26 木子欢儿 阅读(877) 评论(0) 推荐(0) 编辑
摘要: 正则表达式的概念 正则表达式的语法 Re库的基本使用 练习: >>> import re >>> match=re.search(r'[1-9]\d{5}','BIT 100081') >>> if match: print(match.group(0)) 100081 >>> 练习: >>> im 阅读全文
posted @ 2020-07-09 15:55 木子欢儿 阅读(330) 评论(0) 推荐(0) 编辑
摘要: http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html 代码: import requests from bs4 import BeautifulSoup import bs4 def getHTMLtext(url):#获取 阅读全文
posted @ 2020-07-09 10:28 木子欢儿 阅读(271) 评论(0) 推荐(0) 编辑