摘要:
TIMIT的结构 NLTK包括TIMIT语料库的一个样本,可以使用help(nltk.corpus.timit)访问他的文档; nltk.corpus.timit.fileids()可以查看语料样本中160个录制的话语列表; 每个文件名如图所示: TIMIT的结构如下: 基本数据类型 TIMIT语料库只包含两种基本数据类型:词典和文本。 语料库创建的三种方案 1、... 阅读全文
摘要:
段落是句子的序列。 段落表示理论 一阶逻辑中的量化标准方法仅局限于单个句子,但是有的量词的范围是可以扩大到两个以上的句子. 看下面的例子: (54)a. Angus owns a dog. It bit Irene.b.∃x.(dog(x) &own(Angus, x)&bite(x, Irene))段落表示理论(Discourse RepresentationTheory,DRT)... 阅读全文
摘要:
基于特征的文法中的合成语义学组合原则:整体的含义是部分的含义与它们的句法结合方式的函数。我们的目标是以一种可以与分析过程平滑对接的方式整合语义表达的构建。类似于下面这幅图:SEM 是语义的意思。1、根节点的SEM显示了整个句子的语义表示。2、较低节点的SEM值显示了句子的成分。3、SEM值要以特殊的方式对待,所以被放在了尖括号里面。可以这样构造文法:S[SEM=<?vp(?np)>]-> NP[SEM=?subj]VP[SEM=?vp]VP[SEM=?v]-> IV[SEM=?v]NP[SEM=<cyril>]-> 'Cyril'IV[ 阅读全文