解决Red Hat / CentOS 下nokogiri抓取网页只返回注释的问题

原因是系统默认安装的libxml 2.6.26已经过时了,需要安装新的版本

$ sudo yum remove -y libxml2-devel libxslt-devel

 

从ftp://xmlsoft.org/libxml2/下载最新的libxml2和libxslt

比如libxml2-2.9.0.tar.gz和libxslt-1.1.28.tar.gz

 

依次安装libxml2和libxslt

$ ./configure ; make ; sudo make install

 

重新安装nokogiri,就可以解决问题

$ sudo gem install nokogiri --with-xml2-lib=/usr/local/lib --with-xml2-include=/usr/local/include/libxml2 --with-xslt-lib=/usr/local/lib --with-xslt-include=/usr/local/include

 

参考

http://nokogiri.org/tutorials/installing_nokogiri.html

https://github.com/sparklemotion/nokogiri/issues/122

 

posted @ 2013-04-12 14:26  scige  阅读(236)  评论(0编辑  收藏  举报