python利用beautifulSoup写爬虫
python BeautifulSoup模块的安装
安装包下载地址:http://www.crummy.com/software/BeautifulSoup/#Download
文档:http://www.crummy.com/software/BeautifulSoup/documentation.html
下载后解压, 然后进入目录执行 :
python setup.py build
python setup.py install
引入包要用
import bs4 from bs4 import BeautifulSoup
利用BeautifulSoup抓取网页内容
1 # coding=utf-8 2 from bs4 import BeautifulSoup 3 import urllib 4 import re 5 6 url ='http://www.baidu.com/s' 7 values ={'wd':u'渗透'} 8 encoded_param = urllib.urlencode(values) 9 full_url = url +'?'+ encoded_param 10 response = urllib.urlopen(full_url) 11 soup =BeautifulSoup(response) 12 alinks = soup.find_all('a', href=re.compile('^http|^/'))
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步