1 FAST ESP 简介
FAST ESP ,微软的主要产品之一。FAST ESP 为FAST Enterprice Search Platform的简称,FAST ESP是一个提供搜索和过滤服务平台的集成软件应用,且是一个分布式系统,可以从任何类型信息里进行信息检索。 它是一个模块化,可扩展的产品套件,整合了实时搜素、高级语言学和多种内容访问选项。目前最新版本是5.3 sp3。
微软企业搜索方案概况
FAST ESP提供如下功能: 1.支持从网站、文件服务器、特定应用上获取或接受content,或者直接通过API提交。 2.转换所有的content,变成ESP内部的documents格式 3.分析和处理这些documents,计算它们之间的相关性。 4.把这些documents索引起来,使他们可以检索。 5.根据这些documents处理搜索查询对象 6.应用逻辑或者商业规则对搜索结果进行排序 6.带有导航选项的搜索结果展示ESP技术简介
系统架构
采集-处理-索引海量的信息 分布式部署 可按需扩展(数据量,并发用户) 内置高可用和负载均衡信息采集
标准的 FAST ESP 连接器 FAST Enterprise Crawler File Traverser Database Connector 其他连接器 BEA WebLogic,Documentum,IBM WebSphere Lotus Notes,MS Exchange MS SharePoint,Vignette Hummingbird,FileNet 支持增量索引,增量索引时不影响搜索文档处理
支持的文档格式超过200种,常见的有HTML,PDF,Text, XML,MS Office和压缩文件 支持用户自定义分词,以提高搜索结果的准确性,增加相关搜索提示的友好性和智能性 文档处理过程支持使用字典,正则表达式或编程模式提炼和企业业务相关的实体,以支持搜索结果的分类导航 元数据:文档语言种类,文档格式,文档大小,文档修改时间 定义分类规则:文档来源 基于行业务字典的分类:关键字,分支机构,产品线,客户名称等 按规则预设文档的相关度排名 门户网站中的文档比论坛和博客中的排名靠前 知识库中的文档的相关度比邮件和OA系统中的排名靠前 文档处理流程 按字典提炼 按规则提炼 按规则提炼搜索体验
快速,准确和有效的搜索 搜索框的语义相关搜索提示 搜索结果的动态导航 搜索条件的同义扩展 动态摘要,高亮显示和直达功能 引导,推荐客户做最佳搜索 标签云的上下文相关搜索提示 搜索条件的歧义纠正 帮助用户发现信息/知识 搜索结果的动态导航 搜索结果排名控制,特色内容 搜索分析和调整 搜索条件的自动提示功能,用户只需输入少量的字或词,系统就知道用户的搜索意图,并且自动进行相关提示 自动提示的内容产生 根据索引的内容自动生成,保证能全面反映索引内容中的关键词 通过自定义分词,反映用户的产品线 从用户的搜索行为中挖掘 同时支持人工定义 当用户搜索某个不是特别清楚的概念时,搜索引擎返回太多的结果,如果仅仅靠相关性排序,是不足以帮助用户快速找到想要的信息的。 导航器能帮助用户缩小查找范围,还起到意想不到的效果,它们能从多方位多角度回答用户的问题,使用户对他的问题获得全面的了解,甚至发现他不知道的信息 导航的纬度可以是文档的元数据,也可以是根据用户需求在文档处理过程中提炼的结果,如文档语言种类,文档格式,文档大小,文档修改时间,文档来源,时间,地点,任务和话题等 搜索结果排名控制和特色内容 特色内容功能(featured content) 搜索业务管理中心提供搜索报告:热门搜索 搜索业务管理中心提供搜索报告:零结果搜索
路在脚下