【NLP CS224N笔记】Lecture 1 - Introduction of NLP

I. 什么是NLP

NLP全称是Natural Language Processing,即自然语言处理,这是一门计算机科学、人工智能以及语言学的交叉学科。

NLP涉及的几个层次由下图所示。可以看到输入数据有两大类,分别是语音和文字。在接收到数据之后还需要做一系列的处理。

  • 首先是speech数据是做语音分析,text则是OCR或者Tokenization。
  • 之后是Morphological analysis,这是形态学的意思,援引《统计自然语言处理》中的定义:

    形态学(morphology):形态学(又称“词汇形态学”或“词法”)是语言学的一个分支,研究词的内部结构,包括屈折变化和构词法两个部分。由于词具有语音特征、句法特征和语义特征,形态学处于音位学、句法学和语义学的结合部位,所以形态学是每个语言学家都要关注的一门学科[Matthews,2000]。

  • 接下来是句法(syntactic)和语义(semantic)分析
  • 最后是对话(discource)分析,也就是说需要根据上下文对当前句子进行分析和处理。

II. 什么是Deep Learning

这里不做过多的赘述。需要了解机器学习基础和deep learning的可以阅读我之前的笔记:

III. NLP相关技术

  • 1.Word Vector

本节视频没有深入介绍,后面的内容会详细介绍。

  • 2.NLP表示层次:形态(Morphology)级别

  • 3.NLP工具:句法分析

image.png

还有其他的NLP技术和应用不在赘述,详细的课观看教学视频和其他笔记



MARSGGBO原创





2018-12-26



posted @ 2018-12-26 16:46  marsggbo  阅读(942)  评论(0编辑  收藏  举报