摘要: from pyquery import PyQuery as pq html = ''' 123 123 123 123 xcxxx ''' # # doc = pq(html) # 获取单个 # p_text = doc('#cc')[0].text # print(p_text) # URL初始化 ... 阅读全文
posted @ 2018-04-03 19:14 qukaige 阅读(663) 评论(0) 推荐(0) 编辑
摘要: ''' 解析器: Python 内置标准库 优势:执行速度适中,文档容错能力强 BeautifulSoup(html,'html.parser') 3.7 or 3.2 容错能力较差 lxml HTML 速度快,文档容错能力强 (最常用) BeautifulSoup(html,'lxml') ... 阅读全文
posted @ 2018-04-03 16:49 qukaige 阅读(1302) 评论(0) 推荐(0) 编辑