WordNet

    WordNet是一个词汇参照系统,是由Princeton(普林斯顿)大学的认知科学实验室开发出 来的,其特点是它依据词义而不是词形来组织词汇信息。WordNet使用同义词集合(Synset)代表概念(Concept),基于单词概念并由此在单 词之间建立一个庞大的网络。其构造的核心是如何表示词汇概念节点,以及在这些概念节点之间建立其各种语义关系。WordNet将英语词汇组织为一个同义词 集合,每个集合表明一个词汇概念;同时力图在概念之间建立不同指针,表达上下位、同义反义等不同点的语义关系,构成比较完整的词汇语义网络系统。
    WordNet将所有词组织在树状的层次结构中,任何两个节点间只有唯一一条路径,该路径长度常作为两个概念语义距离的一种度量,即可利用词节点间上下位关系构成的最短路径来计算词语间的相似度,距离越小,相似度越大。
    在WordNet2.1中主要包括名词、动词、形容词和副词四类实词,没有考虑虚词,重点在名词和动词(近10个概念节点和500万个语义关系)。词汇概 念的语义关系主要包括:上下位、同义、反义、整体和部分、蕴含、属性、致使等。可进行词义标注、基于词义分类的统计模型、基于概念的文本检索、文本校对、 知识处理及推理和概念建模等操作。
    WordNet的使用: 在界面的搜索框中输入单词后,会显示出该词相应词性的解释。同时 会显示对应的词性的按钮,一般有这几项:同义词(Synonyms)、与其意思并列的词汇(Coordinate Terms)、从属关系(hypernmys ?)、(Meronyms)、以及派生和Family等。每个词语(word)可能有多个语义,对应不同的sense,每个不同语义(sense)又可能 对应多个词。在列出的几个Sense中,一般常见的词义在前,其中括号中的数字表示该词以该语义在语料中出现的次数。

posted @ 2011-10-12 18:55  Alex.XW.Wang  阅读(550)  评论(0编辑  收藏  举报