Scrapy 安装
参考:http://www.open-open.com/lib/view/open1420624463656.html
抓取网站的代码实现很多,如果考虑到抓取下载大量内容,scrapy框架无疑是一个很好 的工具。下面简单列出安装过程。PS:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。
1.安装Python
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里(在python2.7以后版本中,安装过程中会有个选项:添加到python到path,勾选即可)。在cmd中输入python如果出现版本信息说明配置完毕(如下面截图)。python下载地址:https://www.python.org/downloads/。
2.安装setuptools 或者 pip
ubuntu linux: sudo apt-get install python-pip
windows:点击https://pypi.python.org/pypi/pip 下载pip-6.1.1.tar.gz (md5, pgp)
解压后进入文件夹执行:python setup.py install
或者直接下载exe文件进行安装,下载地址为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pip
3.安装lxml
lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。选择对应的Python版本安装。;
安装命令:pip install lxml
验证是否安装成功:>>>import lxml
4.安装zope.interface,安装命令:
pip install zope.interface
5.安装Twisted
Twisted是用Python实现的基于事件驱动的网络引擎框架,安装命令:
pip install twisted
6.安装pyOpenSSL
pyOpenSSL是Python的OpenSSL接口,安装命令:
pip install pyopenssl
7.安装win32py (windows需要)
提供win32api,点击 http://sourceforge.net/projects/pywin32/files/pywin32/下载
8.安装Scrapy
easy_install scrapy
或者:pip install scrapy
9.测试是否scrapy可用:
scrapy bench
安装完成,开始使用吧!