会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
bep_code
博客园
首页
新随笔
联系
订阅
管理
2018年8月16日
数据的采集,清洗,数据机器自动标注及转化为深度学习格式
摘要: 例子是来自基于深度学习的特定领域命名实体识别课题介绍如何利用原始数据生成测试集、训练集、验证集(看注释)这其中字典的价值很重要,需要自己创建(这里想到的是利用爬虫技术获取) #如何利用原始数据生成测试集、训练集、验证集 #encoding=utf8 import os,jieba,csv import jieba.posseg as pseg #os.getcwd()获取当前的工作路径,os....
阅读全文
posted @ 2018-08-16 18:07 bep_code
阅读(1587)
评论(0)
推荐(0)
编辑
公告