05 2017 档案

摘要:这次主要学习了替换各种标签,规范格式的方法。依然参考博主崔庆才的博客。 1.获取url 某一帖子:https://tieba.baidu.com/p/3138733512?see_lz=1&pn=1 其中https://tieba.baidu.com/p/3138733512?为基础部分,剩余的为参 阅读全文
posted @ 2017-05-20 16:48 三年一梦 阅读(1034) 评论(0) 推荐(0) 编辑
摘要:闲来无事,学学python爬虫。 在正式学爬虫前,简单学习了下HTML和CSS,了解了网页的基本结构后,更加快速入门。 1.获取糗事百科url http://www.qiushibaike.com/hot/page/2/ 末尾2指第2页 2.先抓取HTML页面 当然这里可能会产生error:主要有H 阅读全文
posted @ 2017-05-19 18:23 三年一梦 阅读(5019) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示