上一页 1 ··· 5 6 7 8 9 10 下一页
摘要: 随着社交媒体的迅猛发展,我们越来越感觉到被纷繁的信息所累,许多不文明信息无孔不入,呼啸而来,我们深陷其中,甚至被裹挟吞噬。在这场信息与噪音的对抗中,我们如何冲出迷障,把握主动权? 面对如此海量的信息流,传统信息过滤技术只能通过简单的关键词匹配,错漏百出,准确率极低,发挥的作用只能是杯水车薪。我们团队 阅读全文
posted @ 2017-07-17 14:15 ljrj123 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 在中文自然语言处理中,词是最小的能够独立活动的有意义的语言成分。汉语是以字为基本书写单位,词语之间没有明显的区分标记,因此进行中文自然语言处理通常是先将汉语文本中的字符串切分成合理的词语序列,然后再在此基础上进行其它分析处理。中文分词是中文信息处理的一个基础环节,已被广泛应用于中文文本处理、信息提取 阅读全文
posted @ 2017-07-05 15:41 ljrj123 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 在计算机广泛应用的今天,数据采集的重要性是十分显著的。它是计算机与外部物理世界连接的桥梁。各种类型信号采集的难易程度差别很大。 灵玖软件Nlpir Parser文本语义挖掘系统以分词技术为基础,集成了全文精准检索、新词发现、分词标注、统计分析、关键词提取、热点分析、文本分类过滤、文档去重、等功能,其 阅读全文
posted @ 2017-06-22 16:12 ljrj123 阅读(225) 评论(0) 推荐(0) 编辑
摘要: Internet是全球信息共享的基础设施,是一种开放和面向 所有用户的技术。它一方面要保证信息方便、快捷的共享;另一方面要防止垃圾信息的传播。网络内容分析是一种管理信 息传播的重要手段。它是网络信息安全核心理论与关键技术 研究网络内容分析所涉及的新理论、新体系结构、新方法和新技术。 内容过滤技术一般 阅读全文
posted @ 2017-06-12 16:44 ljrj123 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 词性标注是自然语言浅层理解的一个重要环节,它可帮助系统自动判定词语所属的语法范畴,为进一步处理提供更高层面的支持。词性标注主要任务是消除词性兼类歧义,对于新信息检测来说,它的实际意义还在于: (1)能够在很大程度上消除词义歧义。 (2)具有提高句子检索性能的潜力。词性标注可以帮助我们保留表征实际意义 阅读全文
posted @ 2017-06-01 16:31 ljrj123 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 文本挖掘或者文档挖掘是一个从非结构化文本信息中获取用户感兴趣或者有用的模式的过程文本挖掘涵盖多种技术,包括信息抽取,信息检索,自然语言处理和数据挖掘技术。它的主要用途是从原本未经使用的文本中提取出未知的知识,但是文本挖掘也是一项非常困难的工作,因为它必须处理那些本来就模糊而且非结构化的文本数据,所以 阅读全文
posted @ 2017-05-16 16:07 ljrj123 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 近年来随着网络技术的飞速发展和用户的剧烈增长,网络传输数据量越来越大,网络用语越来越趋于多样化。如何快速的屏蔽用户的不当言论、过滤用户发表内容中的非法词汇已成为关键词匹配领域的一项重大难题。 目前主要过滤技术,即数据库过滤、关键字过滤。由于数据库过滤方法对许多寄生在综合性网站内的不良信息无法过滤,对 阅读全文
posted @ 2017-05-05 16:03 ljrj123 阅读(312) 评论(0) 推荐(0) 编辑
摘要: 全文索引用于处理大文本集合,利用它人们可以在海量文本中快速获取需要的信息。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上 阅读全文
posted @ 2017-04-21 14:58 ljrj123 阅读(722) 评论(0) 推荐(0) 编辑
摘要: 随着互联网的迅猛发展,信息的爆炸式增加,信息超载问题变的越来越严重,信息的更新率也越来越高,用户在信息海洋里查找信息就像大海捞针一样。搜索引擎服务应运而生,在一定程度上满足了用户查找信息的需要。然而互联网的深入发展和搜索引擎日趋庞大,进一步凸现出海量信息和人们获取所需信息能力的矛盾。那么,如何从中获 阅读全文
posted @ 2017-04-01 15:48 ljrj123 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 关键词是指能反映文本主题或者意思的词语,如论文中的Keyword字段。大多数人写文章的时候,不会像写论文的那样明确的指出文章的关键词是什么,关键词自动提取任务正是在这种背景下产生的。 目前,关键词自动提取方法分为两类:1)关键词分配,预先定义一个关键词词库,对于一篇文章,从词库中选取若干词语作为文章 阅读全文
posted @ 2017-03-21 16:32 ljrj123 阅读(1490) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 下一页