SharePoint 2010配置PDF文件全文检索
SharePoint 2010配置PDF文件全文检索
一、安装Adobe PDF 64 bit IFilter version 9合Adobe Reader 9
下载地址: http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025
二、修改注册表
2.1、修改位置一:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Applications\{site GUID}\Gather\Portal_Content\Extensions\ExtensionList
添加.pdf键值。
这一步可以通过再搜索服务——文件类型——添加。
2.2、修改位置二:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\Filters\.pdf
修改为:
i. <REG_SZ> Default = <value not set>
ii. <REG_SZ> Extension = pdf
iii. <REG_DWORD> FileTypeBucket = 1
iv. <REG_SZ> MimeTypes = application/pdf
如果没有,可以导出其它类型的,修改后再导入。
2.3、修改位置三:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf
修改为:
i.<REG_MULTI_SZ> Default = {E8978DA6-047F-4E3D-9C78-CDBE46041603}
如果没有,可以导出其它类型的,修改后再导入。
三、修改图标显示
添加图标到C:\Program Files\Common Files\Microsoft Shared\web server extensions\12\TEMPLATE\IMAGES,
修改文件C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\12\TEMPLATE\XML\docicon.xml,
添加XML条目:<Mapping Key="pdf" Value="pdf.gif">,
四、修改环境变量
我看到有的文章说要添加pdf reader的安装路径到系统环境变量
C:\Program Files (x86)\Adobe\Reader 9.0\Reader
五、重新执行搜索爬网
执行命令行:net stop osearch14 ;net start osearch14 ;iisreset
到管理中心,搜索服务页面执行一次完全爬网。
再到SharePoint站点上取搜索Pdf内容可以了~~
另这几篇文章说的挺详细的:
Adobe官方的:
http://www.adobe.com/special/acrobat/configuring_pdf_ifilter_for_ms_sharepoint_2007.pdf?PID=4172469
Msdn上的:
http://blogs.msdn.com/b/ifilter/archive/2007/03/29/indexing-pdf-documents-with-adobe-reader-v-8-and-moss-2007.aspx
这老兄的:
http://www.cnblogs.com/ruijian/archive/2010/09/09/1822575.html