2017年12月11日
摘要: 本篇目标 1.对百度贴吧的任意帖子进行抓取 2.指定是否只抓取楼主发帖内容 3.将抓取到的内容分析并保存到文件 1.URL格式的确定 先观察百度贴吧url格式,以中南财经政法大学迎新帖为例,URL我们划分基础部分是 http://tieba.baidu.com/p/5174106966,参数部分是  阅读全文
posted @ 2017-12-11 20:48 小学森也要学编程 阅读(376) 评论(0) 推荐(0) 编辑