会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
yetuweiba
博客园
首页
新随笔
联系
订阅
管理
2014年12月7日
提取网页正文的开源库的比较
摘要: 前段时间在工作中,需要提取出网页的正文,就试验了一下机中提取网页正文开源库。试验中主要试验了java和python两种提取正文的开源库,测试的连接是:http://www.chinanews.com/gj/2014/11-19/6791729.shtml。结果如下:A.Java:1.Cx-extra...
阅读全文
posted @ 2014-12-07 18:44 yetuweiba
阅读(2448)
评论(0)
推荐(0)
编辑
公告