02 2021 档案
摘要:首先使用句子分割器将该文档的原始文本分割成句,使用分词器将每个句子进一步细分为词。接下来,对每个句子进行词性标注,在下一步命名实体识别中将证明是非常有益的。在这一步我们,我们寻找每个句子中提到的潜在的有趣的实体。最后,我们使用关系识别搜索文本中不同实体间的可能关系。
阅读全文
摘要:最大熵原理认为要选择的概率模型首先必须满足已有的事实,即约束条件。在没有更多信息的情况下,那些不确定的部分都是“等可能的”。最大熵原理通过熵的最大化来表示等可能性。
阅读全文
摘要:朴素贝叶斯分类器和最大熵分类器之间的一个重要差异是他们可以被用来回答问题的类型。朴素贝叶斯分类器是一个生成式分类器的例子,建立一个模型,预测P(input, label)对的联合概率。因此,生成式模型可以用来回答下列问题: 1.一个给定输入的最可能的标签是什么? 2.对于一个给定输入,一个给定标签有
阅读全文