摘要: 找了几个贴 https://www.cnblogs.com/uestc-mm/p/6656325.html 这个最好 阅读全文
posted @ 2019-08-27 11:27 Mr喃先森 阅读(1641) 评论(0) 推荐(0) 编辑
摘要: 开始用scrapy 爬取数据的时候 开始用同步操作始终会报1064 的错误 因为 mysql 语法和导入的字段不兼容 尝试了 n 次之后 开始用 异步爬取 虽然一路报错 但是还是能把数据保存到mysql 数据库里 关于spider: 关于 item 关于setting 关于 异步的爬取 重点 阅读全文
posted @ 2019-03-27 15:36 Mr喃先森 阅读(447) 评论(1) 推荐(0) 编辑
摘要: 1.在setting.py中找到 ALLOWED_HOSTS = [] 改为 ALLOWED_HOSTS = ['*',]2.启动服务时使用如下命令行 python .\manage.py runserver 0.0.0.0:31453.在防火墙中打开端口的访问权限 https://jingyan. 阅读全文
posted @ 2019-03-24 10:43 Mr喃先森 阅读(700) 评论(0) 推荐(0) 编辑
摘要: 在 模板之家中 前端页面直接上去抓取 可是遇到重复 或者 版本不统一 所以 在每个app下面建立自己的 stastic 在制作的html 页面上方 导入静态页面 每个APP下都有自己的static文件夹,那如何设置将不会混用呢 以下是实例(我项目里有两个APP(login 和main)) 1、首先在 阅读全文
posted @ 2019-03-16 11:58 Mr喃先森 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 关于 spinder 在这个框架里面 和不用数据库 相同 关于 pipelines 的 管道设定 setting 的设置 关于item 的设置 这个一定要有 用spider 里面的 yield 来进行传递 字典 阅读全文
posted @ 2019-03-12 19:36 Mr喃先森 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 这次先没有数据库 spider 关于setting 阅读全文
posted @ 2019-03-12 09:36 Mr喃先森 阅读(255) 评论(0) 推荐(0) 编辑
摘要: HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。 HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加入SSL层。 阅读全文
posted @ 2019-03-02 21:28 Mr喃先森 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 获取元素标签的内容: get_attribute(‘textContent’) 获取元素内的全部HTML: get_attribute('innerHTML') 获取包含选中元素的HTML: get_attribute('outerHTML') 阅读全文
posted @ 2019-02-21 10:54 Mr喃先森 阅读(1553) 评论(0) 推荐(0) 编辑
摘要: Session 是单用户的会话状态。当用户访问网站时,产生一个 sessionid。并存在于 cookies中。每次向服务器请求时,发送这个 cookies,再从服务器中检索是否有这个 sessionid保存的数据; Cookie同session一样是保存你个人信息的,不过是保存在客户端,也就是你使 阅读全文
posted @ 2019-02-03 10:39 Mr喃先森 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 静态文件 项目中的CSS、图片、js都是静态文件。一般会将静态文件放到一个单独的目录中,以方便管理。在html页面中调用时,也需要指定静态文件的路径,Django中提供了一种解析的方式配置静态文件路径。静态文件可以放在项目根目录下,也可以放在应用的目录下,由于有些静态文件在项目中是通用的,所以推荐放 阅读全文
posted @ 2019-01-23 16:58 Mr喃先森 阅读(220) 评论(0) 推荐(0) 编辑