摘要:
http://nssug.baidu.com/su?wd=李冰冰&prod=video_ala 阅读全文
摘要:
1.pyspider 在win10 64位系统下安装64位3.5版本python,运行时出错。 解决方式安装32位python。 2.pip 安装pyspider时遇到lxml出错。 解决方式: 1. 安装wheel,命令行运行: pip install wheel 2.在这里下载对应的.whl文件 阅读全文
摘要:
python调用selenium实现登陆开心网,下载指定专辑内的照片。整个过程调用火狐浏览器实现,可看到每一步的操作步骤。过程中遇到一些问题总结如下: 1.selenium定位元素时有时使用常规的id,name,class name,等方式都无法定位时,可以考虑使用xpath实现定位。比如某些元素属 阅读全文
摘要:
程序通过采集人人小站的json文件获得某个标签下的所有gif图片及对应的图片描述。主要用到urllib.request正则,错误和异常处理。 中间遇到了不少坑,正则不熟练,以及采集中遇到的编码问题。当在json中采集时遇到字符表情时候就会出问题。遇到字符表情无法写入txt中。 程序自动崩溃,停止运行 阅读全文
摘要:
python3.4 第一只爬虫,主要用到urllib,request。正则表达式。代码比较渣渣 阅读全文