摘要:
符号分割文本转化为markdown表格形式 写博客,做笔记的时候,有时需要复制表格到markdown文档,数量一多一个个添加格式还是很麻烦,然后就写了一个小工具,先将表格复制粘贴到文本,用工具转换,再复制粘贴到markdown文档.. 阅读全文
摘要:
```python
# 爬取知乎发现页面,用文件存储 import requests
from pyquery import PyQuery as pq def get_html(url): '''根据网址获取html页面 parameter:url目标网址 return:html页面 ''' headers = { ... 阅读全文
摘要:
[TOC] pyquery库 侧重于css选择器,JQuery 安装:pip3 install pyquery GitHub: PyPI: 官方文档: DOM操作文档: CSS选择器参考: 初始化 基本CSS选择器 函数操作 函数和jQuery中函数的用法完全相同,函数中也可以传入选择器 查找节点 阅读全文
摘要:
[TOC] Beautiful Soup库 官方文档: 中文文档: PyPI: 安装:pip3 install beautifulsoup4 导入:包名为bs4: from bs4 import BeautifulSoup Beautiful Soup的HTML和XML解析器是依赖于lxml库,安装 阅读全文
摘要:
[TOC] XPath及lxml解析 安装:pipenv install lxml XPath的用法: lxml库文档: xpath语法 一般通过对Xpath解析对象方法xpath('')中运用xpath规则,得到所需节点和属性 1.XPath常用路径表达式 "返回目录" + nodename:选取 阅读全文