MSSCrawlUrl

这张表保存了在索引(Index)中的所有的item的一份列表. 当我们说起爬网的"历史"的时候, 这就是我们所涉及的东西.

 

AccessUrl列, 保存了被发送到protocol handler中取回item的URL.

 

DisplayUrl 列, 是供爬网日志的Object Model使用的.

 

ParentDocId列, 其中保存的是一份docid.

 

其他比较重要的列有CrawlId , CommitCrawlId , ErrorId , ErrorDesc , ErrorLevel , TransactionFlags.

 

这张表如果很大, 也不允许用户手动的删除的, 否则会引起搜索的问题.

posted on 2010-01-18 13:35  中道学友  阅读(231)  评论(0编辑  收藏  举报

导航

技术追求准确,态度积极向上