摘要: 1. 抓不到接口,不要着急提取页面信息,先搜索下网络资源,没准就有人分享对应的接口信息。 2 抓取页面信息,一定先用导出curl 相关命令,一般情况下能正常返回页面信息,尽量不要selenium启动页面抓取 3. url中包含#,要去掉 4. requests请求一定要带着user-agent,否则 阅读全文
posted @ 2020-05-12 23:04 sunshine_5 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 验证css:$$('title') 验证xpath: $x('//h2') 阅读全文
posted @ 2020-05-12 17:15 sunshine_5 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 服务端修改: 1. 服务端/etc/rsyncd.conf port = 3380pid file = /var/run/rsyncd.pidlog file = /var/log/rsyncd.loguid = rootgid = rootuse chroot = nomax connection 阅读全文
posted @ 2020-05-12 14:33 sunshine_5 阅读(554) 评论(0) 推荐(0) 编辑