关于如何下载安装html5lib解析器
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id49
给出了如何安装,在windows系统下主要就是:pip install html5lib(被推荐用)
那么问题来了,pip 不是系统内部命令,需要安装,在网址http://www.cnblogs.com/a7265813/archive/2013/12/18/3479919.html中有说明。
这里把顺序调整好了
0:将python的安装路径添加到环境变量path中,例如C:\python27,目的是能够让系统识别命令python
1:先下载两个文件
pip文件:https://pypi.python.org/pypi/pip#downloads
ez_install文件:http://pypi.python.org/pypi/setuptools
2:安装ez_install文件,先cd到下载路劲中例如:D:\setuptools-17.1.1
在命令窗口中输入:python setup.py install
3:安装pip文件,先cd到下载路劲中例如:D:\pip-7.0.3
在命令窗口中输入:python setup.py install
4:增加安转后的pip路劲
C:\python27\Scripts
5:重启输入命令窗口,接着输入:
pip install html5lib
最后就可以正常使用了
BeautifulSoup(html, "html5lib")