会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
悟空```
博客园
首页
新随笔
联系
订阅
管理
2019年9月4日
文本处理实验
摘要: 数据:本文采用的数据为搜狗新闻语料文本http://www.sogou.com/labs/resource/cs.php 首先逐个读入已下载的txt文件内容,正则表达出URL(新闻类别)和content(新闻内容) 具体代码如下: SamplesGen.py 1.字符数小于30的将不被content
阅读全文
posted @ 2019-09-04 20:35 悟空```
阅读(272)
评论(0)
推荐(0)
编辑
公告