Web获取的一些思考

帮朋友做一个天气预报的web获取的方式。

之前是使用分析XML的方法去分析HTML,有点类似阅读网页源码的味道去获取数据。这样的好处是比较有逻辑性。而且直接获取标签的值,不像直接处理字符串的方式那么原始。坏处,如果网页标签有所变得,程序需要可能要重写。

另一种办法,是我在尝试的,使用正则表达式。这样有一个好处就是。把正则表达式可以作为配置文件,以后网页有修改也没事。

还有一种,我是否可以根据class,id,name等属性直接导航到我索要找到的节点。目前这个办法,我是使用多重循环的办法。深度优先遍历。

posted @ 2010-09-22 21:57  伊一线天  阅读(213)  评论(0编辑  收藏  举报