SharePoint 2010配置PDF文件全文检索

SharePoint 2010配置PDF文件全文检索

一、安装Adobe PDF 64 bit IFilter version 9合Adobe Reader 9
下载地址: http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025

二、修改注册表
2.1、修改位置一:
  HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Applications\{site GUID}\Gather\Portal_Content\Extensions\ExtensionList
  添加.pdf键值。
  这一步可以通过再搜索服务——文件类型——添加。

2.2、修改位置二:
  HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\Filters\.pdf
  修改为:
    i. <REG_SZ> Default = <value not set>
    ii. <REG_SZ> Extension = pdf
    iii. <REG_DWORD> FileTypeBucket = 1
    iv. <REG_SZ> MimeTypes = application/pdf
  如果没有,可以导出其它类型的,修改后再导入。

2.3、修改位置三:
  HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf
  修改为:
    i.<REG_MULTI_SZ> Default = {E8978DA6-047F-4E3D-9C78-CDBE46041603}
  如果没有,可以导出其它类型的,修改后再导入。

三、修改图标显示
  添加图标到C:\Program Files\Common Files\Microsoft Shared\web server extensions\12\TEMPLATE\IMAGES,
  修改文件C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\12\TEMPLATE\XML\docicon.xml,
  添加XML条目:<Mapping Key="pdf" Value="pdf.gif">,

四、修改环境变量
  我看到有的文章说要添加pdf reader的安装路径到系统环境变量
  C:\Program Files (x86)\Adobe\Reader 9.0\Reader

五、重新执行搜索爬网
  执行命令行:net stop osearch14 ;net start osearch14 ;iisreset
  到管理中心,搜索服务页面执行一次完全爬网。

再到SharePoint站点上取搜索Pdf内容可以了~~
另这几篇文章说的挺详细的:
Adobe官方的:
http://www.adobe.com/special/acrobat/configuring_pdf_ifilter_for_ms_sharepoint_2007.pdf?PID=4172469
Msdn上的:
http://blogs.msdn.com/b/ifilter/archive/2007/03/29/indexing-pdf-documents-with-adobe-reader-v-8-and-moss-2007.aspx
这老兄的:
http://www.cnblogs.com/ruijian/archive/2010/09/09/1822575.html

posted on 2014-09-22 16:03  haipsun  阅读(208)  评论(0编辑  收藏  举报