会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
靠谱杨
文章内出现的公众号名称可能有误请统一搜索:靠谱杨的秘密基地; 我的github:https://github.com/SAH01
博客园
首页
新随笔
联系
订阅
管理
2022年10月17日
科技报告数据语料处理(关键词、中图分类名称)
摘要: 科技报告语料处理 接着上次爬取到的科技报告数据进行处理【参考 https://www.cnblogs.com/rainbow-1/p/16725576.html】 为了建立科技报告的分类模型,现将其关键字和中图分类名称进行汇总,作为原始语料库。 先前爬取的数据,存在数据格式不统一不规范的问题,比如分
阅读全文
posted @ 2022-10-17 23:17 靠谱杨
阅读(206)
评论(0)
推荐(0)
编辑
公告