摘要: 符号分割文本转化为markdown表格形式 写博客,做笔记的时候,有时需要复制表格到markdown文档,数量一多一个个添加格式还是很麻烦,然后就写了一个小工具,先将表格复制粘贴到文本,用工具转换,再复制粘贴到markdown文档.. 阅读全文
posted @ 2018-07-24 17:29 WY~记录 阅读(772) 评论(1) 推荐(0) 编辑
摘要: ```python # 爬取知乎发现页面,用文件存储 import requests from pyquery import PyQuery as pq def get_html(url): '''根据网址获取html页面 parameter:url目标网址 return:html页面 ''' headers = { ... 阅读全文
posted @ 2018-07-24 16:44 WY~记录 阅读(428) 评论(0) 推荐(0) 编辑
摘要: [TOC] pyquery库 侧重于css选择器,JQuery 安装:pip3 install pyquery GitHub: PyPI: 官方文档: DOM操作文档: CSS选择器参考: 初始化 基本CSS选择器 函数操作 函数和jQuery中函数的用法完全相同,函数中也可以传入选择器 查找节点 阅读全文
posted @ 2018-07-24 14:09 WY~记录 阅读(172) 评论(0) 推荐(0) 编辑
摘要: [TOC] Beautiful Soup库 官方文档: 中文文档: PyPI: 安装:pip3 install beautifulsoup4 导入:包名为bs4: from bs4 import BeautifulSoup Beautiful Soup的HTML和XML解析器是依赖于lxml库,安装 阅读全文
posted @ 2018-07-24 10:15 WY~记录 阅读(177) 评论(0) 推荐(0) 编辑
摘要: [TOC] XPath及lxml解析 安装:pipenv install lxml XPath的用法: lxml库文档: xpath语法 一般通过对Xpath解析对象方法xpath('')中运用xpath规则,得到所需节点和属性 1.XPath常用路径表达式 "返回目录" + nodename:选取 阅读全文
posted @ 2018-07-24 08:14 WY~记录 阅读(193) 评论(0) 推荐(0) 编辑