Alive_2020 - 博客园

2018年12月14日

摘要：今日概要基于终端指令的持久化存储基于管道的持久化存储 1.基于终端指令的持久化存储保证爬虫文件的parse方法中有可迭代类型对象（通常为列表or字典）的返回，该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作。执行输出指定格式进行存储：将爬取到的数据写入不同格式的文件中进行存储阅读全文

posted @ 2018-12-14 18:56 Alive_2020 阅读(830) 评论(0) 推荐(0) 编辑

爬虫-scrapy框架简介和基础应用

摘要：一.什么是Scrapy？ Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）的具有很强通用性的项目模板。对于框架的学习，重点是要学习其框架的特性、各个功能的用法即可。二.安装阅读全文

posted @ 2018-12-14 18:53 Alive_2020 阅读(176) 评论(0) 推荐(0) 编辑

爬虫-移动端数据爬取

摘要：前言随着移动市场的火热，各大平台都陆陆续续的推出了自己的移动端APP来拉拢吸引和便捷其广大的用户。那么在移动端的平台当时势必会出现大量有价值的信息和数据，那这些数据我们是否可以去享用一下呢？那么接下来就进入我们的移动端APP数据的爬虫中来吧。 1、什么是Fiddler? Fiddler是位于客户阅读全文

posted @ 2018-12-14 18:52 Alive_2020 阅读(1049) 评论(0) 推荐(0) 编辑

爬虫-图片懒加载技术、selenium和PhantomJS

摘要：动态数据加载处理一.图片懒加载什么是图片懒加载？案例分析：抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree 阅读全文

posted @ 2018-12-14 18:45 Alive_2020 阅读(292) 评论(0) 推荐(0) 编辑

爬虫-验证码处理

摘要：引入关的门户网站在进行登录的时候，如果用户连续登录的次数超过3次或者5次的时候，就会在登录页中动态生成验证码。通过验证码达到分流和反爬的效果。使用云打码平台识别验证码云打码平台处理验证码的实现流程： - 1.对携带验证码的页面数据进行抓取 - 2.可以将页面数据中验证码进行解析，验证码图片下载阅读全文

posted @ 2018-12-14 18:43 Alive_2020 阅读(398) 评论(2) 推荐(0) 编辑

爬虫-pyquery模块

只有注册用户登录后才能阅读该文。阅读全文

posted @ 2018-12-14 18:41 Alive_2020 阅读(6) 评论(0) 推荐(0) 编辑

爬虫-requests模块

摘要：引入 Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。警告：非专业使用其他 HTTP 库会导致危险的副作用，包括：安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。今日概要基于requests的get请求基于requests模块的p 阅读全文

posted @ 2018-12-14 18:28 Alive_2020 阅读(299) 评论(1) 推荐(0) 编辑

爬虫-三种数据解析方式

摘要：引入回顾requests实现数据爬取的流程其实，在上述流程中还需要较为重要的一步，就是在持久化存储之前需要进行指定数据解析。因为大多数情况下的需求，我们都会指定去使用聚焦爬虫，也就是爬取页面中指定部分的数据值，而不是整个页面的数据。因此，本次课程中会给大家详细介绍讲解三种聚焦爬虫中的数据解析方式阅读全文

posted @ 2018-12-14 18:27 Alive_2020 阅读(1886) 评论(1) 推荐(0) 编辑

爬虫-urllib模块

摘要：一.urllib库 urllib是Python自带的一个用于爬虫的库，其主要作用就是可以通过代码模拟浏览器发送请求。其常被用到的子模块在Python3中的为urllib.request和urllib.parse，在Python2中是urllib和urllib2。二.由易到难的爬虫程序： 1.爬取百阅读全文

posted @ 2018-12-14 18:24 Alive_2020 阅读(195) 评论(2) 推荐(0) 编辑

2018年12月13日

爬虫-scrapy数据的持久化存储-temp

该文被密码保护。阅读全文

posted @ 2018-12-13 20:05 Alive_2020 阅读(8) 评论(0) 推荐(0) 编辑

2018年12月12日

爬虫-HTTP协议回顾篇

摘要：一.HTTP协议 1.官方概念： HTTP协议是Hyper Text Transfer Protocol（超文本传输协议）的缩写,是用于从万维网（WWW:World Wide Web ）服务器传输超文本到本地浏览器的传送协议。 2.白话概念： HTTP协议就是服务器（Server）和客户端（Clie 阅读全文

posted @ 2018-12-12 20:20 Alive_2020 阅读(278) 评论(2) 推荐(0) 编辑

爬虫-概念普及篇

摘要：爬虫介绍引入我们都知道，当前我们所处的时代是大数据的时代，在大数据时代，要进行数据分析，首先要有数据源，而学习爬虫，可以让我们获取更多的数据源，并且这些数据源可以按我们的目的进行采集。优酷推出的火星情报局就是基于网络爬虫和数据分析制作完成的。其中每期的节目话题都是从相关热门的互动平台中进行相关阅读全文

posted @ 2018-12-12 20:01 Alive_2020 阅读(253) 评论(0) 推荐(0) 编辑

2018年12月8日

算法篇-常见算法

该文被密码保护。阅读全文

posted @ 2018-12-08 20:33 Alive_2020 阅读(7) 评论(0) 推荐(0) 编辑

2018年12月7日

JavaScript登录记住密码操作(超简单代码)

该文被密码保护。阅读全文

posted @ 2018-12-07 20:08 Alive_2020 阅读(3) 评论(0) 推荐(0) 编辑

JavaScript实现强制重定向至HTTPS页面

摘要：有时候需要把网页强制切换成HTTPS，即使用户已经访问了HTTP的版本。原因可能是你不想让用户使用HTTP来访问，因为它不安全。要做到这个很简单，如果不想用PHP或者Apache的mod_rewrite来做这件事，用Javascript也可以。代码如下：用了这段代码，如果用户访问了如http:// 阅读全文

posted @ 2018-12-07 14:25 Alive_2020 阅读(1198) 评论(0) 推荐(0) 编辑

MongoDB-文件数据库

摘要：一、简介 MongoDB是一款强大、灵活、且易于扩展的通用型数据库 MongoDB 是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统。在高负载的情况下，添加更多的节点，可以保证服务器性能。 MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB 将数据存阅读全文

posted @ 2018-12-07 13:59 Alive_2020 阅读(503) 评论(3) 推荐(0) 编辑

Django的时区设置问题

摘要： 1.Django的时区问题 django默认的时区是UTC，平时是没有什么影响的，但是在需要将时间戳转换成本时区的时间或者是获取当前的本地的localtime的时候就出现了问题。之前程序在测试时是运行在Windows环境，所以即使settings.py中的TIME_ZONE使用默认时区，Django 阅读全文

posted @ 2018-12-07 11:41 Alive_2020 阅读(2218) 评论(0) 推荐(0) 编辑

2018年12月4日

面向对象-魔法语法汇总

摘要： python魔法方法详解据说,Python 的对象天生拥有一些神奇的方法,他们总被双下划线锁包围,他们是面向对象的python的一切. 他们是可以给你的类增加魔力的特殊方法,如果你的对象实现(重载)了这些方法的某一个,那么这个方法就会在特殊的情况下被python调用. 你可以定义自己想要的行为,而阅读全文

posted @ 2018-12-04 19:28 Alive_2020 阅读(113) 评论(0) 推荐(0) 编辑

2018年12月3日

JS-MD5加密

该文被密码保护。阅读全文

posted @ 2018-12-03 21:16 Alive_2020 阅读(3) 评论(0) 推荐(0) 编辑

CMDB硬件信息管理系统开发

该文被密码保护。阅读全文

posted @ 2018-12-03 18:02 Alive_2020 阅读(3) 评论(1) 推荐(0) 编辑

2018年12月2日

Django rest framework 版本控制(源码分析)

摘要：一、前言通过DRF写的视图类，都会继承APIVIEW，而APIVIEW类继承VIEW，同时其重写了as_view方法【使之cbv能够url传参】，dispatch方法，重新封装了request对象，将老的request对象赋值为_request, 前端传过来的所有数据给了：request.dat 阅读全文

posted @ 2018-12-02 23:21 Alive_2020 阅读(256) 评论(0) 推荐(0) 编辑

Django rest framework 的认证流程(源码分析)

摘要：一、基本流程举例: urlpatterns = [ url(r'^admin/', admin.site.urls), url(r'^users/', views.HostView.as_view()), ] from rest_framework.views import APIView from 阅读全文

posted @ 2018-12-02 23:21 Alive_2020 阅读(455) 评论(0) 推荐(0) 编辑

Django rest framework 权限操作(源码分析)

摘要：这一篇是基于上一篇写的，上一篇谢了认证的具体流程，看懂了上一篇这一篇才能看懂，当用户访问是首先执行dispatch函数，当执行当第二部时：进入到initial方法：下面开始权限的具体分析：进入到check_permissions函数中查看permission_denied方法(如果h 阅读全文

posted @ 2018-12-02 23:21 Alive_2020 阅读(544) 评论(0) 推荐(0) 编辑

Django rest framework 序列化组件

摘要：最近在DRF的序列化上踩过了不少坑，特此结合官方文档记录下，方便日后查阅。【01】前言 serializers是什么？官网是这样的”Serializers allow complex data such as querysets and model instances to be converte 阅读全文

posted @ 2018-12-02 23:20 Alive_2020 阅读(535) 评论(1) 推荐(0) 编辑

django连接多个mysql数据库

摘要： python3之Django多数据库 https://www.cnblogs.com/zhangxinqi/p/9094953.html 阅读目录 1、定义数据库（1） DATABASES内部选项：（2）自定义数据库 2、同步数据库 3、自动数据库路由（1）定义数据库路由方法类（2）使用路由阅读全文

posted @ 2018-12-02 22:50 Alive_2020 阅读(5516) 评论(0) 推荐(0) 编辑

Django框架-admin的应用

摘要：一、单个添加model的方式使用用django提供的管理后台，对model表数据操作 1、建立model 2、在admin.py文件中引入modle，然后注册 3、创建超级用户登录就可以向数据库中增删改查数据了二、批量添加的方式 1、建立model，然后在顶部设置__all__ = [] 变量阅读全文

posted @ 2018-12-02 22:45 Alive_2020 阅读(263) 评论(0) 推荐(0) 编辑

django框架-request对象

摘要： HTTP 应用的信息是通过请求报文和响应报文传递的，关于更多的相关知识，可以阅读《HTTP权威指南》获得。其中请求报文由客户端发送，其中包含和许多的信息，而 django 将这些信息封装成了 HttpRequest 对象，该对象由 HttpRequest 类创建。每一个请求都会生成一个阅读全文

posted @ 2018-12-02 20:55 Alive_2020 阅读(216) 评论(0) 推荐(0) 编辑

2018年12月1日

django的crsf机制防御详解及在前后端分离中post数据到django-vue

摘要： django的crsf机制防御详解及在前后端分离中post数据到django 更新于: 2018-07-28 | 分类于 django CSRF(Cross Site Request Forgery) 跨站点伪造请求某个用户已经登陆了你的网站，另外有一个恶意的网站有一个指向你网站的链接，那么当用户阅读全文

posted @ 2018-12-01 22:26 Alive_2020 阅读(1845) 评论(1) 推荐(0) 编辑

前后端分离，解决跨域问题及django的csrf跨站请求保护

摘要：参考至：https://www.cnblogs.com/xiami303/articles/3206416.html https://www.cnblogs.com/cdemo/p/5158663.html 阅读全文

posted @ 2018-12-01 22:26 Alive_2020 阅读(4090) 评论(0) 推荐(0) 编辑

Javascript实现页面跳转的几种方式

摘要：【转】Javascript实现页面跳转的几种方式概述相信很多Web开发者都知道，在开发Web程序的时候，对于页面之间的跳转，有很多种，但是有效的跳转则事半功倍，下面就是我在平时的开发过程中所用到的一些JavaScript跳转方式，拿出和大家共享一下。一、通过JS跳转页面第一种：直接跳转加参数阅读全文

posted @ 2018-12-01 18:10 Alive_2020 阅读(5038) 评论(4) 推荐(0) 编辑

2018年11月30日

python3_requests模块详解

摘要： https://www.cnblogs.com/ranxf/p/7808537.html 阅读全文

posted @ 2018-11-30 21:04 Alive_2020 阅读(115) 评论(0) 推荐(0) 编辑

2018年11月29日

项目-开发手机app

摘要：一. 安装Hbuilder，和夜神安卓模拟器注：夜神模拟器，如过windows中安装了hyper-v，需要卸载，不然会死机二. Hbuilder简介官网：http://www.dcloud.io/ 文档：http://dev.dcloud.net.cn/mui/ 1. 创建移动app ： ht 阅读全文

posted @ 2018-11-29 20:59 Alive_2020 阅读(490) 评论(0) 推荐(0) 编辑

2018年11月28日

Flask Web开发入门

摘要： Flask Web开发入门（八）之文件上传 https://blog.csdn.net/kangkanglou/article/details/79027425 前端：详情见上面的链接/也可以直接用form表单发post 后端视图：注另解：直接通过form表单实现 https://blog.csd 阅读全文

posted @ 2018-11-28 18:01 Alive_2020 阅读(276) 评论(0) 推荐(0) 编辑

2018年11月27日

形象理解Api和SDK

该文被密码保护。阅读全文

posted @ 2018-11-27 15:17 Alive_2020 阅读(2) 评论(0) 推荐(0) 编辑

2018年11月26日

js和JQuery入口函数的区别

摘要： ### 一、原生Js和jQuery入口函数加载模式不同。 ``` 1、原生Js会等到DOM元素加载完毕，并且图片也加载完毕才会执行； 2、jQuery会等到DOM元素加载完毕，但不会等到图片加载完毕就会执行。 ``` ### 二、编写多个入口函数的区别。 ``` 1、原生Js如果编写多个入口函数，后阅读全文

posted @ 2018-11-26 17:28 Alive_2020 阅读(1455) 评论(0) 推荐(0) 编辑

2018年11月21日

git笔记

摘要：管理工作目录 mkdir xxx cd xxx git init 初始化 git status 查看工作树状态 git log 查看提交记录 git reflog 查看之前所有的操作记录 git 三个状态切换工作区暂存区本地仓库 git add ./<filename> 工作区到暂存区 git 阅读全文

posted @ 2018-11-21 19:58 Alive_2020 阅读(369) 评论(0) 推荐(0) 编辑

2018年11月20日

Flask框架-蓝图系统

摘要： Flask之蓝图系统一、创建蓝图（1）在主项目下创建目录（2）在目录下创建蓝图模块文件（3）在文件中导入蓝图模块，创建实例对象，如何创建视图，创建路由（4）在主项目文件，通过falsk实例对象注册蓝图对象前言：蓝图就相当于django中的一个个app，里面可以建立自己的templates 阅读全文

posted @ 2018-11-20 20:32 Alive_2020 阅读(556) 评论(0) 推荐(0) 编辑

Flask框架-路由系统

摘要： Flask之路由系统 1、两种添加路由的方式 2、添加路由关系的本质将url和视图函数封装成一个Rule对象，添加到Flask的url_map字段中 3、动态参数路由常用路由系统有以上五种，所有的路由系统都是基于一下对应关系来处理： 4、反向生成url：url_for() endpoint('n 阅读全文

posted @ 2018-11-20 17:05 Alive_2020 阅读(399) 评论(0) 推荐(0) 编辑

2018年11月19日

Flask框架-基础

摘要：一、简介轻量级的框架，非常快速的就能把程序搭建起来 Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架，对于Werkzeug本质是Socket服务端，其用于接收http请求并对请求进行预处理，然后触发Flask框架，开发人员基于Flask框架阅读全文

posted @ 2018-11-19 21:18 Alive_2020 阅读(659) 评论(2) 推荐(0) 编辑

2018年11月16日

电子商城项目（项目背景以及表结构设计）

该文被密码保护。阅读全文

posted @ 2018-11-16 19:37 Alive_2020 阅读(5) 评论(1) 推荐(0) 编辑

公告