2021年4月27日
摘要: 词性标注是指为输入文本中的单词标注对应词性的过程。词性标注的主要作用在于预测接下来一个词的词性,并为句法分析、信息抽取等工作打下基础。通常地,实现词性标注的算法有HMM(隐马尔科夫)和深度学习(RNN、LSTM等)。然而,在中文中,由于汉语是一种缺乏词形态变化的语言,没有直接判断的依据,且常用词兼类 阅读全文
posted @ 2021-04-27 17:59 Yuki-lsq 阅读(840) 评论(0) 推荐(0) 编辑
摘要: 命名实体识别是指对现实世界中某个对象的名称的识别。与词性标注一样,是自然语言处理的技术基础之一。它的作用主要是通过模型识别出文本中需要的实体,也可以推导出实体之间的关系(实体消歧)。 本文介绍的是运用Python从头训练一个spaCy模型来识别中标公告中中标公司的名字,现通过爬虫爬取了大约200篇中 阅读全文
posted @ 2021-04-27 16:46 Yuki-lsq 阅读(1214) 评论(0) 推荐(0) 编辑