摘要:
[TOC] 这篇博客及之后的系列,我会向大家介绍各种验证码的识别。包括普通图形验证码,极验滑动验证码,点触验证码,微博宫格验证码。 一.普通图形验证码 之前的博客已向大家介绍了简单的图形验证码的处理过程,但是会和实际的有所差别,这是因为验证码内的多余线条与图案干扰了图片的识别。因此,对于这种情况,需 阅读全文
摘要:
[TOC] 在之前的博客中,我们学习了selenium的用法,它是一个动态抓取页面的方法,但是,动态抓取页面还有其他的方法,这里介绍Splash方法,并结合具体实例进行讲解。 一:Splash简介与准备 1.简介 Splash是一个JavaScript渲染服务,说到js大家肯定会想到网页,对的,Sp 阅读全文
摘要:
今天向大家介绍app爬取。 @[TOC] 一:爬取主要流程简述 1.APP的爬取比Web爬取更加容易,反爬虫没有那么强,且大部分数据是以JSON形式传输的,解析简单。 2.在APP中想要查看请求与响应(类似浏览器的开发者工具监听到的各个网络请求和响应),就需要借助抓包软件。 3.在抓取之前,需要设置 阅读全文
摘要:
[TOC] 下面向大家介绍几个python算法题。 一:二分法求平方根 1.题目要求为 2.输入输出格式为 3.博主解题的思路 这道题在c语言中是一道经典的题目,可以用循环,或者递归,在这里我们用python来写。无论是循环还是递归,都是下面的思路: 阅读全文
摘要:
[TOC] c++是一种中级语言,是c的扩充,是一种面向对象的程序设计语言,可以运行到多个平台。这里直接讲语法。 基础c++模板: javascript 函数类型 函数名(参数表);例如: int max(int x,int y,int z); int 阅读全文
摘要:
[TOC] 在python对数据的处理方式中,数据挖掘和数据分析是两个重要的方式,目的是为了从数据中获取具有科研或者商业价值的信息。而数据挖则掘是从大量的数据中通过算法搜索隐藏在数据中隐含的、先前未知的并有潜在使用价值的信息的过程。本篇将讨论数据挖掘的一些入门知识。 &ems 阅读全文
摘要:
[TOC] 由于python有动态解释性语言的特性,跑起代码来相比java、c++要慢很多,尤其在做科学计算的时候,十亿百亿级别的运算,让python的这种劣势更加凸显。 因此就出现了解决python慢的一大利器numba,可以让python的运行速度 阅读全文
摘要:
[TOC] 在python中,实际书写代码还有很多需要注意的东西,有时候会让代码的执行效率提高,下面就让我们来学习PEP 8风格以及Python编程惯例的一些知识吧。 一:PEP 8风格 PEP是Python Enhancement Proposal的 阅读全文
摘要:
[TOC] 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。从数据中提取知识,也被称为预测分析 或 统计学习。 &ems 阅读全文