摘要:
该模块相当于爬取100个页面,打开每个页面提取自己所需要的东西 更改的话食用方式是创建个urls列表(对应下方的get_url()函数) urls = ['https://music.douban.com/top250?start={}'.format(str(i)) for i in range( 阅读全文
摘要:
巧妙的使用单下划线 nums=(1,2,3,4,5,6,7,8,9) head,*_,tail=nums # *_ 可代表中间那堆东西么 print (head) print (tail) 类的属性封装 class Person(): pass person=Person() # 如果你有一个字典需 阅读全文
摘要:
管道简介 作用是处理抓取的数据,包括 清洗数据 检查抓取的数据是否有效 去重 保存数据 一个项目包含多条管道,爬虫收集到的Item会根据指定顺序传递给管道进行处理。 官方的项目管道的典型用途有 清理HTML数据 验证抓取的数据(检查项目是否包含某些字段) 检查重复项(并删除它们) 将爬取的项目存储在 阅读全文
摘要:
首先把解压后的selenium.exe文件的路径加入环境变量,可还是会报错(大概就是在路径中找不到) 网上大概讲了这两种方式的解决手段 第一种是把selenium.exe复制到“C:\Users\xxxx\AppData\Local\Programs\Python\Python36\Lib\site 阅读全文
摘要:
有个问题 模板中如何加入变量;比如时间参数等,这不可能写死把,一般从数据库中提取出来的 这个直接加变量名,不用加{{}}之类的,也不要加'',加引号就是为了表示这个就是个字符串 查看正在使用的数据库 复制代码 隐藏代码(啥意思,自己看都看不懂) select database(); 用命令行来执行字 阅读全文
摘要:
对于input的表单来说,.value即是表单中的值 meta http-equiv="X-UA-Compatible" content="IE=edge"> meta 中的name属性设置了就容易被搜索引擎搜到,提高SEO ;initial-scale=1用于表示页面无缩放的展示在第一次被显示的时 阅读全文
摘要:
sys模块的一些其他用法 sys.argv[1]是从控制台获取的参数,既是python用命令执行语句传入的参数 sys.stdin 标准输入 sys.stdout 标准输出sys.stdout.write()用于输出对象的字符串表示到标准输出,print函数就是调用该方法 sys.stderr 标准 阅读全文
摘要:
###看不懂Js代码 时间应该是11月10号左右写的把 很难受,天气还冷,这空气吹过来,脚冷 (function(){ jQuery = window.jQuery = window.$ = function(){}; })() 还可以这么多等号的 序号是自己做笔记时写的 1.在Web浏览器,全局对 阅读全文
摘要:
###第一章 Django建站基础: 讲解基本的web知识点,网站的定义和组成,各种网站的分类,网站运行原理及开发流程.等 ####域名知识讲解: 如百度的,前面的www是网络名,在前面的https是通信协议,baidu.com才是域名,com代表是一个国际域名。 常见的域名后缀 .com:商业性的 阅读全文
摘要:
###Django的30条操作指令:在终端输入 python manage.py help即可展示 使用方式 基本上都是 python manage.py xxx 30条命令及含义 [auth] changepassword 修改内置用户表的用户密码 createsuperuser 为内置用户表创建 阅读全文