摘要:
from pyquery import PyQuery as pq html = ''' 123 123 123 123 xcxxx ''' # # doc = pq(html) # 获取单个 # p_text = doc('#cc')[0].text # print(p_text) # URL初始化 ... 阅读全文
摘要:
''' 解析器: Python 内置标准库 优势:执行速度适中,文档容错能力强 BeautifulSoup(html,'html.parser') 3.7 or 3.2 容错能力较差 lxml HTML 速度快,文档容错能力强 (最常用) BeautifulSoup(html,'lxml') ... 阅读全文