SharePoint Enterprise Search基础知识点拾遗系列之二

三种Gatherer Projects

==================

Main Gatherer Project(Portal_Content)

------------

Portal_Content 是主要的gatherer project. 当我们为Protal_Content爬内容的时候, 我们把元数据(metadata)放在property store中, 也就是在Search DB中. 我们把全文索引放入文件系统中, 为Portal Content存储内容. 简单来说, 就是被搜索文件的属性在search db中, 被搜索文件的内容在文件系统的索引文件中.

 

Anchor Project

-------------

Anchor Project把Search DB中的anchor表中的内容取出来, 然后填充至另一个全文索引中, 即Anchor index. 我们还向其中填充统计信息. 都做好了之后, 会把Anchor Index整合进主要的catelog index中.

 

Profile Import Project

-------------

第三种是Profile Import Project. 这个project跟搜索引擎没啥关系. 它跟profile的存储有关系. 它就是我们获取目录服务(比如Active Directory)中的用户信息后, 去掉多余的信息, 然后创建一种内部结构并存储在SSP DB的地方. 它的处理过程与爬一个文档的过程非常相似. 处理过的数据会被MySite, User Profile使用.  Profile Import也能像搜索一样的配置schedule. 把这个project放入search service要比单独再写一个service要容易, 所以要想让User Profile可以正常工作, Search必须正常.

posted on   中道学友  阅读(241)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2009-12-03 [翻译文章]我们是如何做到的: SharePoint.Microsoft.com
2009-12-03 常用英语食品词汇- 海产类

导航

< 2010年12月 >
28 29 30 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8

技术追求准确,态度积极向上

点击右上角即可分享
微信分享提示