09 2018 档案

摘要:爬虫工程师最牛逼的地方是什么??? 爬虫工程师最牛逼的地方是什么??? 爬虫工程师最牛逼的地方是什么??? 今天突然想到了这个问题,是因为解决工作的时候,突然想到了这个问题,我的答案是: 爬虫不在乎你每天爬取多少数据,不在乎你爬取多少网站,而是自己写的代码,运行错误的时候能随时的去改正这个错误,我认 阅读全文
posted @ 2018-09-26 11:08 淋哥 阅读(1885) 评论(0) 推荐(1) 编辑
摘要:一: 问题描述: 爬虫微博 信息,出现302跳转, 比如访问的URL是:https://weibo.com/2113535642?refer_flag=1001030103_ (图片中标记为1) 然后跳转的URL是:https://weibo.com/sgccjsdl?refer_flag=1001 阅读全文
posted @ 2018-09-21 18:42 淋哥 阅读(6992) 评论(0) 推荐(0) 编辑
摘要:需求: str1 = " " 想把 这段字符串的标签全部都去掉,比如去掉 </li>, </ul>, </div>.。只保留不带<>的内容,但是要保留<br/>, 有什么好的办法吗?使用正则可以实现这个工作: 输出结果是: 阅读全文
posted @ 2018-09-06 16:39 淋哥 阅读(7303) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示