会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lmei's 备忘录
记性不好,需要备忘~
博客园
首页
联系
订阅
管理
2013年12月5日
爬虫技术 -- 基础学习(一)HTML规范化(附特殊字符编码表)
摘要: 最近在做网页信息提取这方面的,由于没接触过这系列的知识点,所以逛博客,看文档~~看着finallyly大神的博文和文档,边看边学习边总结~~ 对网站页面进行信息提取,需要进行页面解析,解析的方法有以下几种: 1、利用HTML标记的分布规律进行解析 2、利用HTML标记间的关系进行解析 3、利用页面的
阅读全文
posted @ 2013-12-05 17:04 lmei
阅读(2225)
评论(0)
推荐(0)
编辑
公告