会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
一蓑烟雨
博客园
首页
新随笔
联系
订阅
管理
2018年6月22日
数据存储
摘要: 1.TXT文本存储 可以用requests将网页源代码获取下来,然后使用pyquery解析库解析,接下来将提取的标题、回答者、回答保存到文本,代码如下: 运行程序,可以发现在本地生成了一个txt文件。 首先,用requests提取知乎的“发现”页面,然后将热门话题的问题、回答者、答案全文提取出来,然
阅读全文
posted @ 2018-06-22 20:53 王琳杰
阅读(626)
评论(0)
推荐(0)
编辑
文本提取及处理
摘要: 文本提取及处理 标题提取: 正文提取: python3中处理:
阅读全文
posted @ 2018-06-22 00:24 王琳杰
阅读(902)
评论(0)
推荐(0)
编辑
公告