关于调试 SharePoint 2010 中的爬网问题的疑难解答提示
原文发布于 2011 年 5 月 1 日(星期日)
最近,我在试图调试 SharePoint 2010 爬网期间发生的一些身份验证问题时,碰到了一个非常好的解决方法。我收到一些错误,并且在从爬网日志中获得我需要的信息以解决发生的其他问题时也遇到困难。于是,鬼使神差,我进入 Fiddler 寻求帮助 (www.fiddler2.com(该链接可能指向英文页面))。
我敢肯定,大多数人都熟悉 Fiddler,所以我就不在这里赘述了。但窍门是利用它捕获爬网期间发生的事情。我发现了一个很妙的方法来完成此项工作,这就是配置 Fiddler 作为爬网帐户的反向代理。可以从这里找到配置 Fiddler 作为反向代理的说明:http://www.fiddler2.com/Fiddler/help/reverseproxy.asp(该链接可能指向英文页面)。我使用 Fiddler 的方法如下:
- 作为爬网帐户登录我的爬网服务器。
- 配置 Fiddler 作为反向代理,如上所述。
- 启动 Fiddler
- 开始新的爬网。
我已经把我的麻烦网站分离成一个单独的内容源。所以,一旦我照着这些步骤做,我就能够看到从爬网程序到该内容源的所有请求,了解它是如何进行身份验证的以及发生了什么情况等。总而言之,经证明,它对于更清楚地理解在那些网站的爬网期间发生了什么情况非常有用。
这是一篇本地化的博客文章。请访问 Troubleshooting Tip for Debugging Crawl Issues in SharePoint 2010 以查看原文