摘要: 兜兜转转,还是要研究文本理解。 自然语言理解(NLU) NLU 是要理解给定文本的含义。本内每个单词的特性与结构需要被理解。在理解结构上,NLU 要理解自然语言中的以下几个歧义性: 词法歧义性:单词有多重含义 句法歧义性:语句有多重解析树 语义歧义性:句子有多重含义 回指歧义性(Anaphoric 阅读全文
posted @ 2020-10-20 22:15 小哪吒呀 阅读(163) 评论(0) 推荐(0)
摘要: https://cloud.tencent.com/developer/article/1134863 大数据文摘: 目前在自然语言理解领域的研究存在哪些难点? 聂再清: 自然语言理解或者语意理解,到目前为止我觉得还是人工智能里面最需要突破的、最难的一个方向。 首先因为自然语言有所谓“多样性”,同一 阅读全文
posted @ 2020-09-22 14:36 小哪吒呀 阅读(645) 评论(0) 推荐(0)
摘要: 读这篇论文主要是要了解一下目前文本理解的研究现状, 带着一个疑问: 文本理解和机器阅读理解的关系,这两者到底是一个东西还是不同的东西?文本理解包含机器阅读理解,还是二者就是同一个方向的不同叫法。 不敢问老师,所以先自己找答案吧! 1. 神经网络机器阅读理解(MRC)发展的前提是数据集的提出,数据集推 阅读全文
posted @ 2020-09-15 19:54 小哪吒呀 阅读(408) 评论(0) 推荐(0)
摘要: Baseline,搭baseline时做文献调研; Proposal,论文有想法时先别急着实验,先写一个proposal,对问题有一个清晰的定义,以及后续工作有哪些。 第一章写动机,目前存在的问题,将问题表达清楚; 第二章,针对问题告诉别人用什么方法,以及为什么要用这种方法,也可以不止一种方法; 第 阅读全文
posted @ 2020-09-14 20:14 小哪吒呀 阅读(109) 评论(0) 推荐(0)
摘要: 这一周也没学啥 Pytorch安装配置,还有简单的学习; 不学习基础知识是学不明白的; 所以还是得把《Python深度学习》这本书学着,边看边学Pytorch代码。 接下来几天就是把师兄给的两篇论文仔仔细细的看完,还有那两本书。 周四开始做PPT吧! 阅读全文
posted @ 2020-08-25 11:25 小哪吒呀 阅读(112) 评论(0) 推荐(0)
摘要: 今天就安装anaconda和pytorch了....... 阅读全文
posted @ 2020-08-20 00:15 小哪吒呀 阅读(114) 评论(0) 推荐(0)
摘要: 一、什么是深度学习 1、机器学习系统是训练出来的,而非明确地用程序写出来的; 2、机器学习需要的三个要素:输入数据点、预期输出的示例、衡量算法效果好坏的方法; 衡量结果是一种反馈信号,用于调节算法的工作方式,这个调节步骤即所说的“学习”;机器学习中的学习指的是:寻找更好数据表示的自动搜索过程; 3、 阅读全文
posted @ 2020-08-13 22:42 小哪吒呀 阅读(424) 评论(0) 推荐(0)
摘要: 句法分析 1、句法是研究句子的每个组成部分和它们之间的组合方式; 常用的句法分析形式为:短语结构分析(phrase structure parsing)和依存分析(dependency parsing); 单词:终结符;词性(动名词等):预终结符;其他句法标记:非终结符; 短语结构树可以转换为依存树 阅读全文
posted @ 2020-08-12 23:35 小哪吒呀 阅读(183) 评论(0) 推荐(0)
摘要: 1、建模 语言模型的目的是描述文字序列出现的规律,这个对问题建模的过程被称作是语言建模; n-gram只和它前面的n-1个词相关,根据这n-1生成第n个词; n-gram在分词、文本生成、信息检索、摘要等NLP任务中都有着举足轻重的地位,包括与训练模型本质上也是统计语言模型; 强调:统计语言模型为解 阅读全文
posted @ 2020-08-11 20:27 小哪吒呀 阅读(153) 评论(0) 推荐(0)
摘要: 中文分词 1、分词:将输入的自然语言字符串切割为单元序列(token序列),每个单元都对应可以处理的最小单位; 分词得到单元序列的过程称作词法分析; 2、基于词典的分词方法: 缺点:过于生硬,当出现歧义时,较难解决; 因此,基于词典的分词方法基于规则,在遇歧义时,需要人工定义消除歧义的规则; 3、基 阅读全文
posted @ 2020-08-10 23:35 小哪吒呀 阅读(147) 评论(0) 推荐(0)