09 2018 档案

命名实体识别从数据集到算法实现
摘要:命名实体识别(Named Entity Recognition, NER)是 NLP 的基础任务,指从文本中识别出命名性指称项,为关系抽取等任务做铺垫。狭义上,是识别出人名、地名和组织机构名这三类命名实体(时间、货币名称等构成规律明显的实体类型可以用正则等方式识别)。当然,在特定领域中,会相应地定义 阅读全文

posted @ 2018-09-15 14:39 bep_code 阅读(18020) 评论(0) 推荐(0) 编辑

初学者如何查阅自然语言处理(NLP)领域学术会议
摘要:原文地址:http://blog.sina.com.cn/s/blog_574a437f01019poo.html 资料作者:刘知远THU 初学者如何查阅自然语言处理(NLP)领域学术会议 昨天实验室一位刚进组的同学发邮件来问我如何查找学术论文,这让我想起自己刚读研究生时茫然四顾的情形:看着学长们高 阅读全文

posted @ 2018-09-13 14:28 bep_code 阅读(1585) 评论(0) 推荐(1) 编辑

中文自然语言处理建模过程中的特征工程
摘要:近来在尝试用传统机器学习方法来做一个中文问答系统,传统机器学习方法建模其实主要的工作在于模型的特征工程,本文主要受哈工大的《中文语义角色标注的特征工程》及其参考文献的启发,分析及总结了在中文的自然语言处理任务的特征工程中可能用到的特征,以及特征提取的方法。 其实在《基于最大熵的中文阅读理解模型》中我 阅读全文

posted @ 2018-09-13 13:03 bep_code 阅读(1207) 评论(0) 推荐(0) 编辑

用深度学习实现自然语言处理:word embedding,单词向量化
摘要:前几年,腾讯新闻曾发出一片具有爆炸性的文章。并不是文章的内容有什么新奇之处,而是文章的作者与众不同,写文章的不是人,而是网络机器人,或者说是人工智能,是算法通过分析大量财经文章后,学会了人如何编写财经报道,然后根据相关模式,把各种财经数据组织起来,自动化的生成一篇文章,当人阅读时,根本无法意识到文章 阅读全文

posted @ 2018-09-12 18:46 bep_code 阅读(1947) 评论(0) 推荐(0) 编辑

特征工程:机器学习中的特征与标签自然语言化
摘要:转自https://zhuanlan.zhihu.com/p/29394867(后期慢慢整理) 在机器学习科研领域中,往往可以看到的是在规整及缺失率低特征的数据集下,固定的生产线解决一个特定的问题。而工业和现实场景中,用户的信息往往是极度稀疏的: 1.企业的目标用户的静态特征可能是平均缺失率在90% 阅读全文

posted @ 2018-09-12 18:21 bep_code 阅读(341) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示