01 2019 档案
摘要:settings 项目地址:https://github.com/CH-chen/renrencookie
阅读全文
摘要:pipelines.py settings 项目地址:https://github.com/CH-chen/suningbook
阅读全文
摘要:pipelines.py settings 项目地址:https://github.com/CH-chen/sun0769
阅读全文
摘要:pipelines.py items,py settings.py 项目地址:https://github.com/CH-chen/tencent
阅读全文
摘要:scrapy 命令: scrapy startproject xx(爬虫目录) 创建爬虫目录 cd xx 进入目录 scrapy genspilder chouti(爬虫名称) chouti.com(起始url) 然后编写 启动爬虫项目: scrapy crawl chouti(爬虫名称) --nolog(不看默认日志) # n...
阅读全文
摘要:FastDFS 是用 c 语言编写的一款开源的分布式文件系统。FastDFS 为互联网量身定制, 充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS 很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。 FastDFS 架构包括 Tracker s
阅读全文
摘要:Celery是一个功能完备即插即用的任务队列。它使得我们不需要考虑复杂的问题,使用非常简单。celery看起来似乎很庞大,本章节我们先对其进行简单的了解,然后再去学习其他一些高级特性。 celery适用异步处理问题,当发送邮件、或者文件上传, 图像处理等等一些比较耗时的操作,我们可将其异步执行,这样
阅读全文
摘要://a[@class="n"]/@href 获取下一页网址//a[text()="下一页>"] 根据文本定位 //div[@class="indent"]/div/table 获取所有table,一级一级选//div[@class="indent"]//table 获取所有table//div[@c
阅读全文

浙公网安备 33010602011771号