2018 年 4月 3 日随笔档案 - qukaige

2018年4月3日

摘要： from pyquery import PyQuery as pq html = ''' 123 123 123 123 xcxxx ''' # # doc = pq(html) # 获取单个 # p_text = doc('#cc')[0].text # print(p_text) # URL初始化 ... 阅读全文

posted @ 2018-04-03 19:14 qukaige 阅读(663) 评论(0) 推荐(0) 编辑

BeautifulSoup解析html - 简单的使用

摘要： ''' 解析器: Python 内置标准库优势:执行速度适中,文档容错能力强 BeautifulSoup(html,'html.parser') 3.7 or 3.2 容错能力较差 lxml HTML 速度快,文档容错能力强 (最常用) BeautifulSoup(html,'lxml') ... 阅读全文

posted @ 2018-04-03 16:49 qukaige 阅读(1302) 评论(0) 推荐(0) 编辑

qukaige

公告