2020年6月28日

推荐系统

摘要: https://blog.csdn.net/greedystar/article/details/80813057 https://blog.csdn.net/Magical_Bubble/article/details/88570960 https://github.com/lpty/recomm 阅读全文

posted @ 2020-06-28 22:47 HBU_DAVID 阅读(124) 评论(0) 推荐(0) 编辑

文本聚类(Text clustering)

摘要: 文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。 作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导 阅读全文

posted @ 2020-06-28 10:48 HBU_DAVID 阅读(1911) 评论(0) 推荐(0) 编辑

文本分类(Text Categorization)

摘要: 对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记。 它根据一个已经被标注的训练文档集合, 找到文档特征和文档类别之间的关系模型, 然后利用这种学习得到的关系模型对 新的文档进行类别判断 。 文本分类从基于知识的方法逐渐转变为基于统计和机器学习的方法。 通常,进行文本分类的主要方法 阅读全文

posted @ 2020-06-28 10:29 HBU_DAVID 阅读(710) 评论(0) 推荐(0) 编辑

信息抽取 (Information Extraction)

摘要: 信息抽取(information extraction),即从自然语言文本中,抽取出特定的事件或事实信息,帮助我们将海量内容自动分类、提取和重构。 这些信息通常包括实体(entity)、关系(relation)、事件(event)。 例如从新闻中抽取时间、地点、关键人物,或者从技术文档中抽取产品名称 阅读全文

posted @ 2020-06-28 10:18 HBU_DAVID 阅读(894) 评论(0) 推荐(0) 编辑

导航