whr0214

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
中文全文检索比较研究
一直以来,倒排表全文索引创建的空间效率(包括最终索引空间和创建过程中需要的辅助空间)和动态全文索引的实现是全文检索研究领域的两大热点,也是难点,到目前为止还没能得到有效解决.该文讨论的中心主题是倒排表全文索引及其动态全文索引的创建,其主线是怎样提高全文索引的创建效率和动态性能.从改进索引的创建算法和改进索引的数据结构两方面着手来解决这一问题.
作者:刘学文专业:软件专业分类号:TP311.132导师:于玉单位:复旦大学
XML全文检索系统的设计与实现
中国国家知识产权局专利局正在开发的中国专利电子申请系统作为电子政务工程,意义十分重大.鉴于国际知识产权组织将XML格式作为专利电子申请文件的描述标准,为了和国际接轨,中国专利电子申请系统也采纳XML标准.在业已实现的电子申请系统中,实现了从客户端XML文档编辑生成,打包传输,接受处理存储的一整套流程.但是,如何使已经存储为XML文档的专利文档能够发挥最大的作用,有效地提供用户检索,是一个非常重要而....
作者:高庆一专业:计算机软件与理论分类号:TP391.3;TP312导师:怀进鹏单位:北京航空航天大学
Web中文股票信息全文检索
论文分为两部分,第一部分对网络信息的获取和全文检索技术中的关键词检索、向量空间检索和自然语言理解检索进行了探讨,重点在于自然语言的理解.第二部分将这些技术应用中文股票文本信息,并对该领域文本信息的特征进行分析,实现了一个具有关键词检索、向量空间检索和初步的自然语言检索功能的面向Web中文股票文本信息的检索系统,取得了较好的效果.
作者:陈强专业:计算机技术分类号:F830.49导师:刘玉树单位:北京理工大学
全文检索技术的研究与实现
该文以宝钢史志全文检索系统为工程背景,分析了现有的中文全文检索系统存在的缺点.在研究现有的文本信息检索技术的基础上,设计了基于概率推理网络的全文信息检索模型,在该模型中对推理网络中的原始推理算法进行改进,并把经过改进的算支与原始的推理算法进行对比研究.该文还提出一种查询扩展技术,实现了对概率推理网络节点的自动扩展,以提高检索系统的查全率.该文研究表明,采用该文提出的全文信息检索模型,可以使检索系统....
作者:于大鹏专业:系统工程分类号:G354.4导师:刘树安单位:东北大学
蒙文单词全文检索系统的实现
在该文中,我们研究和借鉴了现有的中英文全文检索技术,提出了实现蒙文单词全文检索的技术和方法,并初步实现了蒙文单词检索系统.在该文中,我们首先剖析了全文检索技术的理论和实现方法.然后通过对现有方法的借鉴和改进,分析了蒙文单词检索系统的体系结构和所要实现的功能,着重介绍了实现思想和具体的实现方法.我们把蒙文单词检索系统通过功能划分成了建立索引子系统和关键词检索子系统,在每个子系统中又划分了不同的功能模....
作者:董正言专业:计算机应用技术分类号:TP311.132.4;G354.45导师:王俊义单位:内蒙古大学
基于全文检索的自动答疑系统的研究
该论文首先分析了国内外全文检索技术的最新发展和应用于远程教育的答疑系统的现状,有针对性地对全文检索引擎进行研究和改造.考虑到多种应用环境下中英文文本为主,多种国家文字或者文本符号并存的情况,该文讨论了利用Unicode编码建立支持多语种的索引库.在词法分析阶段,提出了中英文混合分词的方案,供全文检索引擎支持不同应用.该论文继续讨论了以全文检索为基础的自动答疑模型.论文提出了利用分词程序构造问题分析....
作者:唐永鹏专业:计算机软件与理论分类号:TP311导师:奚建清单位:华南理工大学
动态全文检索系统的设计与实现
该文借用操作系统和数据库的实现思想,对倒排表的存储结构进行优化,提高了索引更新的灵活性.文中给出了该结构的详细设计并提出基于该结构的操作算法.另外,为了快速定位倒排文件的索引头,即关键字的信息,该文采用了B+树的结构创建二次索引,并结合全文检索系统的特点,对该索引的更新算法进行了优化以提高更新的速度.该文根据对全文检索系统特性的分析,给出了索引更新时解决该系统并发控制的三个优化方案,在保证更新速度....
作者:李熳专业:计算机应用技术分类号:TP391导师:张曙光;刘英单位:武汉大学
科学数据库全文检索系统的研究与实现
该文首先探讨了全文检索技术发展和概况,简单介绍了日益成熟的全文检索技术以及对于 中文全文检索还需要解决的问题.然后介绍了科学数据库及其信息系统的优点、不足和改进的需求.接着,结合科学数据库的特点和全文检索技术的优势,探讨了如何在Web下给用户提供更好的服务.在其中,结合压缩索引的技术,提出在科学数据库设立多层索引的技术.最后,该文探讨了全文检索中核心算法的设计与实现,对现有系统的总结以及对进一步工作的展望.
作者:朱戈专业:计算机软件与理论分类号:TP311.13导师:阎保平单位:中国科学院计算机网络信息中心
基于全文数据库的全文检索算法研究与实现
该文讨论了设计全文数据库的一些关键技术,提出了一种基于单字表的全文数据库的构架方法,同时将单汉字无标引全文检索与全文后控检索方式相结合,有助于提高检索速度和检索的查全率.在检索算法方面,依据构造的全文数据库,该文提出了具体的检索算法公式.该文对检索结果集的排序问题进行了讨论,并采用用户反馈信息量,使最后检出的结果在应用中不断得到优化.在全文数据库和全文检索算法已经在具体环境下编程实现.
作者:李梅专业:模式识别与智能系统分类号:TP311.13导师:王庆林单位:北京理工大学
基于全文检索系统的文档关联研究与实现
论文的主要内容为:1.提出了一种基于全文检索的文档关联方法.该方法结合了中文分词、文档分析等多种技术的特点,将文档的内容和属性进行结合,建立了文档间的相互关联关系.2.将中文分词技术应用于全文检索和文档关联研究,尤其是使用了改进的复合词生成算法,提高了文档关联算法的准确率.3.详细介绍了一种为全文检索和文档关联技术开发的Com组件.该组件可以应用于全文检索系统的建立和文档关联技术的实现.可以帮助用....
作者:饶祎专业:计算机软件与理论分类号:TP391导师:蔡庆生单位:中国科学技术大学
合计21个 | 页次:1/3页 1 [2] [3] 下一页
posted on 2008-04-29 11:33  very论文  阅读(232)  评论(0编辑  收藏  举报