[导入]蛙蛙推荐:基于标记窗的网页正文提取算法的一些细节问题
摘要: 网页的正文提取有好多种算法,有基于视觉的,基于标记窗的,基于双层决策等算法,这里讨论一些基于标记窗的算法(相对简单且效果还好)的相关细节问题,如下
阅读全文
文章来源:http://www.cnblogs.com/onlytiancai/archive/2008/04/09/1145879.html
阅读全文
文章来源:http://www.cnblogs.com/onlytiancai/archive/2008/04/09/1145879.html