摘要:
-(BOOL)application:(UIApplication*)application willFinishLaunchingWithOptions:(NSDictionary *)launchOptions //告诉代理进程启动但还没进入状态保存 -(BOOL)application:(UIApplication*)application didFinishLaunchingWith... 阅读全文
摘要:
#创建爬虫 #把需要请求的url放到一个混淆的url请求list中去,避免被监测到总是访问此页面 #到middlewares.py文件中去 #到settings.py文件中去,修改如下配置 阅读全文
摘要:
浅拷贝:你和你的影子,你改变,你的影子发生改变 深拷贝:你的克隆人,你改变,你的克隆人并不会发生变化 eg: 阅读全文
摘要:
#项目中需要给系统类添加属性 #需要注意的地方就是.m中 set 和 get ,get方法中方法名和添加的属性名一致,set中可以用驼峰 阅读全文
摘要:
看个小说,各种广告烦人,自己写个爬虫爬到本地 #开始工程 #首先创个爬虫 -创建 CrawlSpider 爬虫 scrapy genspider -c crawl [爬虫名字] [域名] #settings.py 文件操作不做解释 #爬取规则 #xpath需要根据具体的爬取内容设置,可以结合scra 阅读全文
摘要:
#安装虚拟环境 pip3 install virtualenv #创建虚拟环境 virtualenv 虚拟环境名字 #进入虚拟环境 1.windows 你如虚拟环境:进入到虚拟环境的scripts 文件夹中,然后执行 active 2.*lnix进入虚拟环境:source/path/to/virtualenv/bin/activate #退出虚拟环境 deactivate #创建虚拟化境... 阅读全文
warnings.warn("allowed_domains accepts only domains, not URLs. Ignoring URL entry %s in allowed_doma
摘要:
多页面循环爬取数据抛出如下异常 warnings.warn("allowed_domains accepts only domains, not URLs. Ignoring URL entry %s in allowed_doma 代码没有报错,只是输出了第一层的Web的爬取结果。但是第二层没有执行爬取。 问题分析 从日志来进行分析,没有发现错误信息;第一层代码爬取正确,但是第... 阅读全文
摘要:
1.from . import D # 导入A.B.D 2.from .. import E # 导入A.E 3.from ..F import G # 导入A.F.G,.. 和 F是连着的,中间没有空格 # .代表当前目录,..代表上一层目录,...代表上上层目录。 阅读全文
摘要:
首先导入一些需要的东东 ,我是在flask中写的,也可以用纯python去写。 #1,一对多关系表 #2, 一对一关系表 #3, 多对多关系表 先导入Table 阅读全文
摘要:
web app 建立在asyncio的基础上,因此用aiohttp写一个基本的app.py 阅读全文