pyquery 基本使用笔记
安装 pip install pyquery 导入 from pyquery import PyQuery as pq 初始化: from pyquery import PyQuery as pq html = ''' <div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2.html">second item</a></li> </ul> </div> ''' doc = pq(html) # 字符串初始化 doc = pq("http://www.baidu.com/") # URL初始化 doc = pq(filename='demo.html') # 文件初始化 # PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的, # 都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择, # PyQuery 是 Python 仿照 jQuery 的严格实现。语法与 jQuery 几乎完全相同 from pyquery import PyQuery as pq doc = pq(html) li = doc('xx') print(li) # 打印匹配到的标签 from pyquery import PyQuery as pq doc = pq(html) lis = doc('xx').items() # 多个元素使用.items()遍历获取 print(type(lis)) # <class 'generator'> for li in lis: print(li) d = pq(html) xx = d('tr:has(th)') # 获取包含有th子标签的tr标签 ''' # print(xx) # 获取匹配到的标签 <tr> <th class="country">国家</th> <th>IP地址</th> </tr> # print(xx.html()) # 获取匹配到的标签的html <th class="country">国家</th> <th>IP地址</th> # print(xx.text()) # 获取匹配到的标签的文本 国家 IP地址 ''' ### 参照jQuery的使用方法来使用pyquery
jQuery 学习笔记