摘要: 前段时间在工作中,需要提取出网页的正文,就试验了一下机中提取网页正文开源库。试验中主要试验了java和python两种提取正文的开源库,测试的连接是:http://www.chinanews.com/gj/2014/11-19/6791729.shtml。结果如下:A.Java:1.Cx-extra... 阅读全文
posted @ 2014-12-07 18:44 yetuweiba 阅读(2448) 评论(0) 推荐(0) 编辑