摘要: 使用BeautifulSoup进行定位提取的时候,因为数据是一个列表,所以会使用到索引,但是经常会提示索引越界 ,这其实就是在我们匹配的时候,太过大意, 如上: 注意td和tr,tr说的是行,td是精确到元素的,所以后面的find_all很重要,td换成tr在执行后面的时候,匹配到的数据一定不一样 阅读全文
posted @ 2017-07-04 18:34 二梦非凡 阅读(1005) 评论(0) 推荐(0) 编辑
摘要: 废话不多说,直接说重点: 刚开始做的时候,代理IP,头部信息池,都已经做好了,使用selenium+phantomjs获取js动态加载后的源码 起初挺好的,能出来动态加载后的源码,但是运行了几次之后,电脑有点卡顿(估计是运存太小),源码就获取不到了,返回的数据 都是空数据,以至于都是出错 在做的时候 阅读全文
posted @ 2017-07-04 18:28 二梦非凡 阅读(2363) 评论(0) 推荐(0) 编辑