摘要: 1.TXT文本存储 可以用requests将网页源代码获取下来,然后使用pyquery解析库解析,接下来将提取的标题、回答者、回答保存到文本,代码如下: 运行程序,可以发现在本地生成了一个txt文件。 首先,用requests提取知乎的“发现”页面,然后将热门话题的问题、回答者、答案全文提取出来,然 阅读全文
posted @ 2018-06-22 20:53 王琳杰 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 文本提取及处理 标题提取: 正文提取: python3中处理: 阅读全文
posted @ 2018-06-22 00:24 王琳杰 阅读(902) 评论(0) 推荐(0) 编辑