如何确定SharePoint 2007的一次增量爬网会处理多少条更新呢?

参考资料的那篇文章做出了非常好的介绍.

 

这里简单做出描述.

1. 在Search DB里看MSSChangeLogCookies表, 找到你想看的CrawlID所在的行, 在该行的ChangeLogCookie_Old列里找到类似下面的信息.

1;0;6ab15b34-0ae5-466a-900b-14405d9193f4;634231800074470000;900

2. 其中的GUID是content DB的id, 最后的900是change id.

3. 用下面的语句先找到目标内容数据库的名字

select * from objects with (NOLOCK) where id = 'f36bbc64-bf9d-4fb8-b76c-d7e547a0777e'

4. 用下面的语句在目标content DB的eventcache表中搜索changeid大于900的条目. 这里的结果就是所有你选中的crawl的下一次应该处理的更新的所有条目了.

 

参考资料

============

How to determine the number of changes an incremental crawl will process prior to initiating the crawl

http://blogs.msdn.com/b/russmax/archive/2008/11/17/how-to-determine-the-number-of-changes-an-incremental-crawl-will-process-prior-to-initiating-the-crawl.aspx

posted on   中道学友  阅读(395)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2009-11-02 汇编语言-指令格式

导航

< 2010年11月 >
31 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 1 2 3 4
5 6 7 8 9 10 11

技术追求准确,态度积极向上

点击右上角即可分享
微信分享提示