复杂HTML解析
面对页面解析难题时候,需要注意问题:
1、寻找“打印次页”的链接,或者看看网站有没有HTML样式更友好的移动版(把自己的请求头设置成处于移动设备的状态,然后接收网站移动版)。
2、寻找隐藏在JavaScript文件里的信息。要实现这一点,可能需要查看网页加载的JavaScript文件。比如一个网站上的街道地址(以纬度和经度呈现的)整理成格式整洁的数组时,查看过内嵌谷歌地图的JavaScript文件,里面有每个地址的标记点。虽然网页标题经常会用到,但是这个信息也许可以从网页的URL链接里获取。
3、如果找的信息只存在于一个网站上,别处没有,那你确实是运气不佳。如果不只限于这个网站,那么可以找找其他数据源。有没有其他网站也显示了同样的数据?网站上显示的数据是不是从其他网站上抓取后攒出来的?
玩无线安全,工控安全,无线电安全等等此相关的技术人员欢迎加群。63309269