随笔 - 404 文章 - 0 评论 - 1037 阅读 - 136万

答火星人.NET。如何使用我的本科毕业程序正文提取DEMO

（更新9.8日，有网友反馈说我的这个程序适用网站范围有限，我不得不说的确如此。它仅能完成对腾讯，凤凰，网易，新浪，东方，南都，等的部分版面做解析，所能解析的版面，都有我程序中提供的URL中所共有的特点。目录页面要包括新闻发布时间，要求具体到小时和分钟（如下图）另外如果你要是想通过该软件抓几个新闻做为语料资源的化，足够用了，我已经以此程序为原型，做了个新闻爬虫爬下新闻4W多篇）

网友火星人.NET，关于如何使用我的毕设程序网页正文提取DEMO，现做说明如下。

1.首先声明，我的程序不能做到完全通用，仅几个大型门户网站可以。而且大型网站的索引页的每条新闻必须包含发布时间（精确到时和分）。

2。使用步骤如下。

一。点击“帖子信息提取”

2。单击左侧树状某节点使其反蓝（一定要有此步）

3。然后点击正文提取按钮

posted on 2010-08-20 19:57 finallyly 阅读(1455) 评论(4) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 周边上新：园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源！
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库，助力快速实现文件压缩解压功能！
· Ollama——大语言模型本地部署的极速利器

公告

昵称： finallyly
园龄： 15年9个月
粉丝： 507
关注： 23

+加关注

2010年8月

日

一

二

三

四

五

六

答火星人.NET。如何使用我的本科毕业程序正文提取DEMO

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

NLP&WebMing&IR

机器学习与人工智能

朋友的博客

阅读排行榜

评论排行榜

推荐排行榜

最新评论

答火星人.NET。如何使用我的本科毕业程序 正文提取DEMO

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

NLP&WebMing&IR

机器学习与人工智能

朋友的博客

阅读排行榜

评论排行榜

推荐排行榜

最新评论

答火星人.NET。如何使用我的本科毕业程序正文提取DEMO