如何确定SharePoint 2007的一次增量爬网会处理多少条更新呢?

参考资料的那篇文章做出了非常好的介绍.

这里简单做出描述.

1. 在Search DB里看MSSChangeLogCookies表, 找到你想看的CrawlID所在的行, 在该行的ChangeLogCookie_Old列里找到类似下面的信息.

1;0;6ab15b34-0ae5-466a-900b-14405d9193f4;634231800074470000;900

2. 其中的GUID是content DB的id, 最后的900是change id.

3. 用下面的语句先找到目标内容数据库的名字

select * from objects with (NOLOCK) where id = 'f36bbc64-bf9d-4fb8-b76c-d7e547a0777e'

4. 用下面的语句在目标content DB的eventcache表中搜索changeid大于900的条目. 这里的结果就是所有你选中的crawl的下一次应该处理的更新的所有条目了.

参考资料

============

How to determine the number of changes an incremental crawl will process prior to initiating the crawl

http://blogs.msdn.com/b/russmax/archive/2008/11/17/how-to-determine-the-number-of-changes-an-incremental-crawl-will-process-prior-to-initiating-the-crawl.aspx

posted on 2010-11-02 11:06 中道学友阅读(395) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· AI与.NET技术实操系列：向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

历史上的今天：
2009-11-02 汇编语言-指令格式

导航

<

2010年11月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

公告

昵称：中道学友
园龄： 16年9个月
粉丝： 238
关注： 1

随笔分类 (1224)

随笔档案 (1206)

阅读排行榜

推荐排行榜

技术追求准确，态度积极向上