SharePoint Enterprise Search基础知识点拾遗系列之一
两种基本结构
===============
第一种, Index和Query角色都在同一台机器上.
第二种, Index和Query角色在不同的机器上. 在这种拓扑结构下, Index会把生成的索引文件逐步地拷贝到Query服务器上, 这个逐步拷贝索引文件的过程叫做propagation. 多台Query服务器的时候, 会有一种自动负载均衡系统来处理来自WFE的查询请求.
一些概念
===============
Gathering Manager | 作用是管理Gatherer Application |
Gatherer Application | 一个增强了的Web Crawler. 当Gatherer Application访问一个文档的时候, 这个Gatherer Application会取得文档内容的一份拷贝, 这份拷贝可能包含诸如文字, 图片, 声音, 和内嵌属性一类的数据. |
Gatherer Project | Gatherer Application的配置单元. 每一个Gatherer Project都有它自己的transaction log, history map, 和crawl restriction rules. 在MOSS2007中, 每个SSP有三个Gatherer Project. 其中仅一个负责制作服务于query的全文索引. 另外的两个, 一个负责anchor crawl, 另一个负责profile import. |
Index Catelog | 被聚集在一起的全文索引文件, query的时候搜索的就是这些文件. 被索引了的文件的任何数据和内容都会存放在这些全文索引的文件中. 在任何时候, 你都可以有一个主索引文件, 和任意数量的shadow索引文件, 它们共同组成了一个catelog |
Property Store | 为了更快地被访问到的内嵌属性的集合. 存储在MOSS 2007的search DB中. |
什么是Anchor?
===============
Anchor就是HTML中的<a …></a>标签.