Stanford NLP学习笔记1:课程介绍
Stanford NLP课程简介
1. NLP应用例子
- 问答系统: IBM Watson
- 信息提取(information extraction)
- 情感分析
- 机器翻译
2. NLP应用当前进展
很成熟:垃圾邮件检测,词性标注(POS),实体名称识别(Named Entity Recognition, NER) => 课程后面会讲
相对成熟:情感分析,指代消解(coreference resolution),词义消歧,句子成分解析(parsing),机器翻译, 信息提取 => 后面课程会讲
依然纠结:问答系统, 转译(paraphrase),主题总结,对话系统
3. 为何NLP如此难搞
主要原因:歧义
- 句法歧义(syntactic ambiguity):由于句子中某一成分可以由多个词来承担导致的歧义。例子:
vs
vs - 词义歧义(word sense ambiguity):由于某个词具有多个含义导致的歧义。例子:
如何消岐(具体以后讲):解析句子结构
其他原因: