数据的采集,清洗,数据机器自动标注及转化为深度学习格式
摘要:例子是来自基于深度学习的特定领域命名实体识别课题介绍如何利用原始数据生成测试集、训练集、验证集(看注释)这其中字典的价值很重要,需要自己创建(这里想到的是利用爬虫技术获取) #如何利用原始数据生成测试集、训练集、验证集 #encoding=utf8 import os,jieba,csv import jieba.posseg as pseg #os.getcwd()获取当前的工作路径,os....
阅读全文
posted @ 2018-08-16 18:07

浙公网安备 33010602011771号