让SharePoint 2010可以搜索PDF文件类型
让SharePoint 2010可以搜索PDF文件类型
默认情况下我们在SharePoint 2010文档库中上载一个PDF类型的文件,由于受到版权问题,文档库是不识别上载的PDF类型文件的。而在搜索中心或搜索框中输入与PDF类型文件相关的关键词时,SharePoint 2010也是搜索不出来的,因为默认情况下搜索服务应用程序的文件类型中是没有.pdf文件类型的。
虽然默认情况下不支持PDF文件类型的搜索,但是可以通过扩充的方法让SharePoint 2010可以搜索PDF类型的文件。
当我们在文档库中上载一个文件时,如果是受支持的文件类型,则会把相应的文件类型图标显示出来,反之则显示一个不被支持的文件类型的图标。如图1所示:
图1
在图1中除了选中的文档以外,其它的文档都是Word文档,“类型”栏下都出现了一个Word文件类型的图标,而图1中选中的那个文件是PDF文件类型,但由于SharePoint 2010不支持PDF文件类型,所以“类型”栏显示的是一个不被识别的类型图标。现在我们稍作修改,让文档库能够识别出PDF类型的文件。
其实SharePoint 2010的所有文件类型的图标路径都是存储在一个叫做DOCICON.XML文件中的。完整的路径为:
D:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\TEMPLATE\XML\
使用记事本打开这个DOCICON.XML文件,如图2所示:
图2
在图2的XML文件中,<ByExtension>标记与</ByExtension>之间的内容就是各个文件的类型图标的路径和其它配置。现在我们到Adobe官方网站上下载一个16*16的图标,下载地址为:http://www.adobe.com/images/pdficon_small.png,并把下载的这个pdficon_small.png图标文件复制到如下路径:
D:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\TEMPLATE\IMAGES\
然后再下载一个名为“PDFiFilter64installer.zip”的服务器端安装程序安装到SharsePoint 2010 Web服务器上,下载地址为:http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=4025&fileID=3941
“PDFiFilter64installer.zip”安装完成之后,把下面的代码:
<Mapping Key="pdf" Value="pdficon_small.png"/>
复制到图2的<ByExtension>和</ByExtension>标记的最后。如图3所示:
图3
保存图3的内容,如果保存时出现“另一个程序正在使用此文件,进程无法访问。”的提示信息,则就重启一下IIS。返回到图1刷新一下,结果如图4所示:
图4
如图4所示,选中的那个PDF类型的文档已经正确的被SharePoint 2010文档库识别了并显示出了PDF类型图标。
现在让我们配置爬网搜索,打开管理中心的“管理服务应用程序”页面,如图5所示:
图5
在图5中找到“Search Service Application”服务应用程序,并选中点击顶部功能区的“管理”图标,如图6所示:
图6
在图6中点击“文件类型”链接,如图7所示:
图7
图7中都是可以被搜索到的文件类型,就是没有pdf文件扩展名,现在我们在图7中点击“新建文件类型”,如图8所示:
图8
在图8的文件扩展名文本框中输入“pdf”点击“确定”按钮,如图9所示:
图9
如图9所示,pdf文件扩展名就被添加上去了,这也表示SharePoint 2010的搜索现在已经支持pdf文件了。
在图6中点击“内容源”,如图10所示:
图10
在图10中点击“启动完全爬网”来执行一次对PDF类型文件的收集,爬网完成之后,我们在搜索中心搜索PDF文件,如图11所示:
图11
如图11,我们在图4中看到的PDF文件已经被SharePoint 2010的搜索中心搜索出来了。