会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
format Blog
给我个权限,我format你的硬盘.
博客园
::
首页
::
博问
::
闪存
::
新随笔
::
联系
::
订阅
::
管理
::
公告
2006年3月6日
HTML解析器项目进展和新的构思
摘要: 这个解析器只是作为个人爱好去研究,陆陆续续的投入精力,持续了很长时间,这期间发生了很多的事情。我在上海落脚很长时间后才又继续开发,并把项目命名为Wittiness。 项目的目的:构建一个Web信息挖掘机,能够高效方便的从网页中截取到需要的信息。 构建思路是:解析HTML标记 --> 构建层次对象 --> 查询获取承载了需要信息的对象 --> 按对象层次输出结果 其中难度比较大的就...
阅读全文
posted @ 2006-03-06 13:39 format
阅读(5084)
评论(17)
推荐(0)
编辑