Validator.nu 本地实例搭建过程

 

Validator.nu是一个验证HTML5文件是否符合标准和规范的一个在线服务,基本上和 W3C Validator 提供的服务类似。W3C的验证期在Ubuntu的软件库中已经有现成可用的(w3c-markup-validator),但是这个现成的验证器如果要验证HTML5的话,还是需要使用Validator.nu。

由于我们只需要验证HTML5的代码,所以计划直接在本地搭建一个Validator.NU的实例。如果要验证的文件比较少,那么可以直接去使用在线服务。如果要验证大量的HTML5页面,在本地搭建一个实例是最合适的了,主要是为了能够快速的得到验证的结果。

在Validator.nu的官方站点上,有一个简单的关于搭建Validator.nu本地实例的说明

mkdir checker
cd checker
hg clone https://bitbucket.org/validator/build build
python build/build.py all
python build/build.py all

但是由于Validator.nu的源代码托管服务bitbucket在国内无法直接访问,所以需要手动的做一些工作才能够完成这个本地实例的搭建。

首先你的机器上应该安装了Java SDK、Tortoise、Python。如果是Windows的机器,还有设置相关的环境变量,保证能够在命令行工具运行javacjavapythonhg命令。

要想从bitbucket上检出Validator.nu的代码,需要使用VPN或者代理的手段翻出去。由于我使用的是Ubuntu Server,在Ubuntu Server上配置VPN比较啰嗦,所以干脆在自己的Mac机器上拨VPN,检出代码后再去Ubuntu Server上build。但是在文档中我是直接截取的在Mac机器上build的代码。

如果你的机器上没有hg命令,请去下载TortoiseHG (这个站竟然是可以访问的!)

yuanyq@yuanyq-mac:~ $ cd apps
yuanyq@yuanyq-mac:~ $ mkdir checker
yuanyq@yuanyq-mac:apps $ cd checker
yuanyq@yuanyq-mac:checker $ hg clone https://bitbucket.org/validator/build build
yuanyq@yuanyq-mac:checker $ python build/build.py checkout

检出源代码之后,就会在checker目录下生成build文件夹,该文件夹下有一个主要的文件就是build.py

源代码检出之后,就可以下载依赖包了,此时无需拨VPN了,以加快下载速度。但是在实际操作中发现,下载jetty-6.1.26.zip依赖包时,速度太慢,甚至最后报出了MD5校验无法通过的错误(难道是因为jetty的新版本被Eclipse项目组收编了之后老版本的服务器不维护了?)。所以,这里我们先使用其他下载工具下载jetty-6.1.26(http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip),然后在本地搭建一个HTTP的服务器,把jetty-6.1.26.zip放置到本地HTTP服务器的根目录,然后修改一下build/build.py脚本,指向本地下载。

修改build.py脚本,找到第92行,将

http://dist.codehaus.org/jetty/jetty-6.1.26/jetty-6.1.26.zip

替换为

http://localhost/jetty-6.1.26.zip

保存修改后的build.py,然后执行依赖包的下载。下载依赖包的时候可以不用VPN,因为依赖包所在的网址都是可以直接访问到的:

yuanyq@yuanyq-mac:~$ cd apps/checker
yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update dldeps

其中--no-self-update参数是告诉脚本不要尝试去bitbucket上下载源文件。 等到依赖包下载完毕之后,就可以build了。build之前要确认JAVA_HOME环境变量设置正确。在我的机器上的.bash_profile中环境变量设置如下:

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export PATH=${JAVA_HOME}/bin:${PATH}

执行build命令:

yuanyq@yuanyq-mac:~/apps/checker$ python build/build.py --no-self-update build

build命令执行成功之后,再重复执行build命令一次,否则在启动服务的时候会发生如下错误:

nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
Error:
Syntax error.
File: http://s.validator.nu/html5/html5full.rnc
Line: 1 Col: 0

Error:
Reference to undefined pattern “common.elem.flow”.
File: http://s.validator.nu/html5-svg-mathml.rnc
Line: 22 Col: 17

两次build命令完成之后,进入nu-validator-site文件夹,修改startit.sh脚本,注释掉JAVA_HOMEPATH的设置,因为在bash环境上已经设置了相关的环境变量了。然后修改脚本中的cd /usr/local/validator.nu一行,设置为在检出代码之前创建的checker目录。最终startit.sh脚本看起来是这样的:

#!/bin/sh

#JAVA_HOME=/usr/local/java
#export JAVA_HOME

#PATH=$JAVA_HOME/bin/:$PATH
#export PATH

cd /some/path/to/apps/checker

if [ "$1" != "" ]
then
    args=$@
else
    args="--no-self-update run"
fi
python build/build.py \
  --w3cbranding \
  --heap=512 \
  --connection-timeout=3 \
  --socket-timeout=3 \
  --html5link=http://www.w3.org/html/wg/drafts/html/master/single-page.html \
  --user-agent=Validator.nu/LV\ http://validator.w3.org/services \
  --name="Ready to validate" \
  $args

最后,就可以通过执行startit.sh来启动服务了。默认的监听端口是8888。

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup ./startit.sh &
[1] 21556
yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ nohup: ignoring input and appending output to ‘nohup.out’

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$

查看一下nohup.out中的输出:

yuanyq@yuanyq-mac:~/apps/checker/nu-validator-site$ cat nohup.out
2013-05-24 11:07:13.437:INFO::Logging to STDERR via org.mortbay.log.StdErrLog
nu.validator.servlet.VerifierServletTransaction - Starting static initializer.
nu.validator.servlet.VerifierServletTransaction - Starting to loop over config file lines.
nu.validator.servlet.VerifierServletTransaction - Finished reading config.
nu.validator.servlet.VerifierServletTransaction - Converted config to arrays.
nu.validator.servlet.VerifierServletTransaction - Prepared namespace array.
nu.validator.servlet.VerifierServletTransaction - Parsed doctype numbers into ints.
nu.validator.servlet.VerifierServletTransaction - The cache path prefix is: null
nu.validator.servlet.VerifierServletTransaction - Parsing set up. Starting to read schemas.
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-its.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/html5-rdfalite.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-strict.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-transitional.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml10/xhtml-frameset.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml5-rdfalite.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/xhtml1-ruby-rdf-svg-mathml.rnc
nu.validator.servlet.VerifierServletTransaction - Will load schema: http://s.validator.nu/svg-xhtml5-rdf-mathml.rnc
nu.validator.servlet.VerifierServletTransaction - Schemas read.
nu.validator.servlet.VerifierServletTransaction - Reading spec.
nu.validator.servlet.VerifierServletTransaction - Spec read.
nu.validator.servlet.VerifierServletTransaction - Initialization complete.
2013-05-24 11:07:16.593:INFO::jetty-6.1.26
2013-05-24 11:07:16.614:INFO::Started SocketConnector@0.0.0.0:8888
Exception in thread "main" java.io.IOException: Bad file descriptor
    at java.io.FileInputStream.readBytes(Native Method)
    at java.io.FileInputStream.read(FileInputStream.java:242)
    at java.io.BufferedInputStream.fill(BufferedInputStream.java:235)
    at java.io.BufferedInputStream.read(BufferedInputStream.java:254)
    at nu.validator.servlet.Main.main(Main.java:120)

最后的一个异常信息不影响应用工作,可以不用管他。

打开浏览器访问http://localhost:8888

至此,Validator.nu本地实例搭建完毕。

posted @ 2013-05-28 09:50  Yuan YuQiang  阅读(1093)  评论(0编辑  收藏  举报