SharePoint Enterprise Search基础知识点拾遗系列之二

三种Gatherer Projects

==================

Main Gatherer Project(Portal_Content)

------------

Portal_Content 是主要的gatherer project. 当我们为Protal_Content爬内容的时候, 我们把元数据(metadata)放在property store中, 也就是在Search DB中. 我们把全文索引放入文件系统中, 为Portal Content存储内容. 简单来说, 就是被搜索文件的属性在search db中, 被搜索文件的内容在文件系统的索引文件中.

Anchor Project

-------------

Anchor Project把Search DB中的anchor表中的内容取出来, 然后填充至另一个全文索引中, 即Anchor index. 我们还向其中填充统计信息. 都做好了之后, 会把Anchor Index整合进主要的catelog index中.

Profile Import Project

-------------

第三种是Profile Import Project. 这个project跟搜索引擎没啥关系. 它跟profile的存储有关系. 它就是我们获取目录服务(比如Active Directory)中的用户信息后, 去掉多余的信息, 然后创建一种内部结构并存储在SSP DB的地方. 它的处理过程与爬一个文档的过程非常相似. 处理过的数据会被MySite, User Profile使用. Profile Import也能像搜索一样的配置schedule. 把这个project放入search service要比单独再写一个service要容易, 所以要想让User Profile可以正常工作, Search必须正常.

posted on 2010-12-03 10:21 中道学友阅读(241) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

历史上的今天：
2009-12-03 [翻译文章]我们是如何做到的: SharePoint.Microsoft.com
2009-12-03 常用英语食品词汇- 海产类

导航

<

2010年12月

>

日

一

二

三

四

五

六

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

公告

昵称：中道学友
园龄： 16年9个月
粉丝： 238
关注： 1

随笔分类 (1224)

随笔档案 (1206)

阅读排行榜

推荐排行榜

技术追求准确，态度积极向上