随笔分类 - Python
摘要:1. 修改redis设置 redis默认处在protection mode, 修改 , , 或者给redis设置密码, 将 这一行用 注释掉 2. 修改爬虫设置 向 加入以下设置 为master的ip加上redis的端口号 3. 修改爬虫代码 使爬虫继承自RedisSpider 增加一个 属性,这个
阅读全文
摘要:0. 安装依赖 1. 安装 python 3.6.4 下载源代码并编译 检查python3.6.4是否安装成功 可以看到python3.6,pip3.6 修改软链接 这是未修改时的/usr/bin 只修改python3,这样就不会影响yum和其他程序的运行 2. install Twisted 3.
阅读全文
摘要:1.range(x,y) [x,y) 2.dics 当key在dics中不存在时返回default的值,返回一个函数也是可以的 判断key在dic中是否存在 两种方法 foreach一个dic 单独循环key或者values 3.读写文件 python中文件被分为两种,text or binary
阅读全文
摘要:1. Pause and resume a crawl Scrapy supports this functionality out of the box by providing the following facilities: a scheduler that persists schedul
阅读全文
摘要:1.概论 弱类型 一个变量能被赋值时能与原类型不同 x = 1 x = "1" #不加分号,给x赋值为int后再次赋值为string是可行的 与或非 and or not / #除法的结果是浮点数, 9 / 3 = 3.0 // #结果是整数 10 // 3 = 3 空值为None(相当于null)
阅读全文
摘要:1.分析 <li><div class="item">电影信息</div></li> 每个电影信息都是同样的格式,毕竟在服务器端是用循环生成的html,这样解析出电影的信息就很简单了 豆瓣电影top250的翻页也很简单,直接就在url上修改一个start就行了,start代表这一页从start+1开
阅读全文