Fork me on GitHub
摘要: 利用selenium以及pyquery,爬取当当网图书信息,并且将数据存入文件以及MongoDB数据库中。 配置文件: dangdang.py 存入到文件中的数据: 存入到MongoDB中: 阅读全文
posted @ 2019-05-27 11:47 iveBoy 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 通过爬取猫眼电影top100,利用正则表达式进行实现,注意在匹配过程中,将需要匹配的内容的开始和结束用关键标志进行区分。 maoyan.py 爬取的内容: 阅读全文
posted @ 2019-05-27 11:35 iveBoy 阅读(475) 评论(0) 推荐(0) 编辑
摘要: 删除页面没有太多的内容和功能 前端html 阅读全文
posted @ 2019-05-26 11:06 iveBoy 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 在模型model中用的都是时间字段DateTimeField字段,在后台处理中可以看到,在生成modelform过程中,继承的是BaseModelForm,而其对时间字段加入了特殊的date_time属性,这样通过前端的bootstrapdatetimepicker来进行时间的填充。 当然这种方式是 阅读全文
posted @ 2019-05-26 11:02 iveBoy 阅读(364) 评论(0) 推荐(0) 编辑
摘要: selenium主要解决浏览器中javascript渲染问题而存在的,有时我们爬取过来的网页内容与实际看到的内容是由差别的,这很有可能就是一些数据是由javascript渲染出来的,如何解决这个问题呢?这时可以引入selenium。 1、申明浏览器对象 2、访问页面 3、查找元素 (1)单个元素 另 阅读全文
posted @ 2019-05-25 11:43 iveBoy 阅读(334) 评论(0) 推荐(0) 编辑
摘要: 正则表达式无论是在爬虫还是其它的应用中都是有一定作用的。 1、常见的匹配模式 2、re.match() re.match()方法会从字符的第一个位置匹配起。如果第一个位置匹配失败的话,就会返回none。 常规匹配 泛匹配 利用.*匹配多个字符 目标匹配 匹配字符串中的数字,正则表达式加上括号表示一个 阅读全文
posted @ 2019-05-24 22:21 iveBoy 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 首先就是MongoDB的下载,可以去MongoDB官网进行下载,https://www.mongodb.com/download-center/community,也可以通过百度网盘直接下载, 链接:https://pan.baidu.com/s/1hLpXYO67ugbBtrz2-fkBjw 提取 阅读全文
posted @ 2019-05-23 17:07 iveBoy 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 如何快速的进行数据的添加以及修改呢?modelform来实现是可以达到效果的,在这里就是应用了modelform,每一个表都不同,所以需要创建不同的modelform。 def get_model_form_class(self, is_add,request,pk, *args,**kwargs) 阅读全文
posted @ 2019-05-23 16:09 iveBoy 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 在这个组件中有内置的4个处理函数,它们都有自己对应的url,那么它们的url是怎么构造的呢? 可以看出来,都是根据url的name反向解析生成对应的url。先changelist_view这个函数为例进行说明。 在这里它的name就是命名空间+app名字+model名字+前缀+参数+changeli 阅读全文
posted @ 2019-05-23 13:27 iveBoy 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 之前主要介绍了前端页面list_fiter功能的显示,但是list_display功能的展示并没有过多介绍,这里介绍一下是如何实现的。 可以看到凡是蓝线圈起来的都是通过字段名反射一个个取出来的,红线的是通过函数来构造的,这也就说明,list_display中单是字段名是不够的,还需要加入一些数据库中 阅读全文
posted @ 2019-05-23 13:27 iveBoy 阅读(176) 评论(0) 推荐(0) 编辑
TOP