摘要:
print(bs.head.contents)#得出来的是列表格式,eg:[xxxx,xxxxx,xxxx] print(bs.head.contents[1])#获取列表中第二个元素 阅读全文
摘要:
from bs4 import BeautifulSoup file=open("./baidu.html","rb") html=file.read() bs=BeautifulSoup(html,"html.parser") print(bs.title) print(bs.a)#将打印出第一个 阅读全文
摘要:
url="https://www.douban.com" headers={"User-Agent":"处理内容可以去真实浏览器中复制"}#有些网站卡的多,可以多写几个头部键值对信息 req=urllib.request.Request(url=url,headers=headers) respon 阅读全文
摘要:
url="http://httpbin.org/post" headers={"User-Agent":"处理内容可以去真实浏览器中复制"}#有些网站卡的多,可以多写几个头部键值对信息 data=bytes(urllib.parse.urlencode({"name":"erick"}),encod 阅读全文
摘要:
print(response.statu)#获取状态码 print(response.getheaders())#获取响应头信息 print(response.getheader('Server'))#获取头部信息里面单个内容信息 阅读全文
摘要:
try: response=urllib.request.urlopen("http://httpbin.org/get",timeout=0.01)#如果0.01秒内数据没有响应就超时 print(response.read().decode("utf-8")) except utllib.err 阅读全文
摘要:
import urllib.parse data=bytes(urllib.parse.urlencode({"hello":"world"}),encoding="utf-8") response=urllib.request.urlopen("http://httpbin.org/post",d 阅读全文
摘要:
import urllib.request response =urllib.request.urlopen("http://www.baidu.com") print(response.read().decode('utf-8'))#对获取到的网页源码进行utf-8解码 阅读全文
摘要:
1.爬取网页 2.逐一解析数据3.讲想要的数据保存 阅读全文
摘要:
<!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <meta name="viewport" content="width=device-width,initial-scale=1.0"> <meta http-equiv= 阅读全文