摘要:
问题一:在scrapy框架中,使用的xpath去获取网站信息,没能拿到? 解决方法:xpath在scrapy框架中使用需要注意两件事:第一是使用的user-agent和你去获取的xpath,使用的浏览器需要相匹配;第二就是需要注意使用谷歌浏览器的时候一定要删去tbody标签,这样就基本可以成功爬取到 阅读全文
摘要:
这次记录的scrapy-splash的安装和使用基本上是两种情况:一是win10比较新的版本+docker for windows;二是win10家庭版,win7(理论上win8也是)+docker toolbox 首先是win10比较新的版本+docker for windows: 前面基本是一键 阅读全文
摘要:
1、简单的在pipelines.py上添加如下代码: 问题:需要删除到爬取数据的第一个元组,解决方法是使用if语句去除第一个元组(其中的美元符号需要除去,其中的一些数据类型如下)如下: 3、保存数据到数据库却不能使得数据重复,解决方法如下: 4、创建一个与spiders的同级的文件夹db,在其下创建 阅读全文
摘要:
练习代码如下: 主函数: setting.py: items.py: start.py: pipelines.py: 阅读全文
摘要:
首先,先去https://www.lfd.uci.edu/~gohlke/pythonlibs/#twsited这个网址下载安装twisted的whl文件。 阅读全文
摘要:
1、问题1: 解决办法:首先,这是因为控制类UserController缺少了一部分代码,这段代码的主要作用是用ApplicationContext 去定位classpath:applicationContext.xml文件,然后获取其中的bean UserService,UserDAO等等。代码如 阅读全文
摘要:
1、安装PIL window键+r打开cmd,在cmd输入:pip install PIL 错误提示: Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribu 阅读全文
摘要:
分享: 1、火狐浏览器使用时会发生找不到element这类的事件,所以需要做好三件事:其一,打开一个新的界面时,需要time.sleep(5)作为短暂的停歇;其二,需要查清所定位的element所在的iframe,需要用一些语句切换iframe;其三,注意写对定位方法。 阅读全文
摘要:
1、在PyCharm中添加selenium: 在命令行中运行 在PyCharm中settings->Project untitled->Project Interperter,绿色加号添加selenium。 如果安装selenium失败,则修改python中的helpers文件夹下的packging 阅读全文
摘要:
首先,先安装好idea和svn,idea的安装教程百度上有很多,就不写了。 svn的安装: 1、安装Setup-Subversion-1.8.9-1.msi,然后在你选定的盘中新建SVNrepository文件夹,在其目录下在创建one文件夹; 2、通过命令行床架多仓库: 3、打开one文件夹下的c 阅读全文