vbs 解析html文档的方法

vbs 解析html文档的方法(htmlfile)

投稿:mdxy-dxy 字体:[增加 减小] 类型:转载 时间:2014-06-18 我要评论

关于VBS采集,网上流行比较多的方法都是正则,其实 htmlfile 可以解析 html 代码,但如果 designMode 没开启的话,有时候会包安全提示信息

关于VBS采集,网上流行比较多的方法都是正则,其实 htmlfile 可以解析 html 代码,但如果 designMode 没开启的话,有时候会包安全提示信息。
但是开启 designMode (@预言家晚报 分享的方法) 的话,所有js都不会被执行,只是干干净净的dom文档,所以在逼不得已的情况下开启 designMode 一般情况保持默认即可。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
Set html = CreateObject("htmlfile")
Set http = CreateObject("Msxml2.ServerXMLHTTP")
 
html.designMode = "on" ' 开启编辑模式
 
http.open "GET", "http://www.cnblogs.com/", False
http.send
strHtml = http.responseText
 
html.write strHtml ' 写入数据
Set post_list = html.getElementById("post_list")
For Each el In post_list.children
  WScript.Echo el.getElementsByTagName("a")(0).innerText
Next

其实方法很简单,但是重点是会vbs的,却不一定都会 dom 操作,所以这个很纠结。
我也没办法,只能靠你们自己了,我只是分享一下思路而已、

这样解析 html 比正则方便快捷多了。

 

posted @ 2017-01-15 00:44  吃饭了吗  阅读(714)  评论(0编辑  收藏  举报