随笔档案「2020年7月9日」：【Python爬虫】淘宝商品比价定向爬虫 ... - 木子欢儿

2020年7月9日

摘要： https://www.taobao.com/ #CrowTaobaoPrice.py import requests import re def getHTMLText(url):#获得网页信息 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 1 阅读全文

posted @ 2020-07-09 17:26 木子欢儿阅读(937) 评论(0) 推荐(0)

【Python爬虫】Re(正则表达式)库入门

摘要：正则表达式的概念正则表达式的语法 Re库的基本使用练习： >>> import re >>> match=re.search(r'[1-9]\d{5}','BIT 100081') >>> if match: print(match.group(0)) 100081 >>> 练习： >>> im 阅读全文

posted @ 2020-07-09 15:55 木子欢儿阅读(347) 评论(0) 推荐(0)

【Pyhton爬虫】中国大学排名爬虫

摘要： http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html 代码： import requests from bs4 import BeautifulSoup import bs4 def getHTMLtext(url):#获取阅读全文

posted @ 2020-07-09 10:28 木子欢儿阅读(297) 评论(0) 推荐(0)

点滴记忆

你知道的越多，你不知道的越多。

公告