摘要: 由于面试的时候有时候会问到python的几个基本内置函数,由于记不太清,就比较难受,于是呕心沥血总结了一下python3的基本内置函数 Github源码: https://github.com/tyutltf/Python_funs 1.abs()函数 2.all()函数详解 3.any()函数 4 阅读全文
posted @ 2019-01-18 18:23 雨轩恋i 阅读(13180) 评论(1) 推荐(0) 编辑
摘要: 在Python里有五大高阶函数,他们分别是lambda()匿名函数,filter()筛选函数,map()函数,reduce()函数,zip()函数。下面就让我们来详细的了解一下这五种函数的具体用法吧。 1.lambda()匿名函数 ''' 匿名函数lambda:是指一类无需定义标识符(函数名)的函数 阅读全文
posted @ 2019-01-07 16:50 雨轩恋i 阅读(2687) 评论(1) 推荐(4) 编辑
摘要: 我们在做爬虫的过程中经常会遇到这样的情况:最初爬虫正常运行,正常抓取数据,一切看起来都是那么的美好,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden;出现这样的原因往往是网站采取了一些反爬虫的措施,比如,服务器会检测某个IP在单位时间内的请求次数,如果超过了某个阈值,那么服务器会直接 阅读全文
posted @ 2018-12-18 20:05 雨轩恋i 阅读(29884) 评论(0) 推荐(1) 编辑
摘要: python下安装tessercor的各种解决办法 阅读全文
posted @ 2018-12-15 10:48 雨轩恋i 阅读(7123) 评论(0) 推荐(0) 编辑
摘要: 因为有在北京租房的打算,于是上网浏览了一下链家网站的房价,想将他们爬取下来,并保存到本地。 先看链家网的源码。。房价信息 都保存在 ul 下的li 里面 ​ 爬虫结构: ​ 其中封装了一个数据库处理模块,还有一个user-agent池。。 先看mylianjia.py # -*- coding: u 阅读全文
posted @ 2018-11-24 17:25 雨轩恋i 阅读(1612) 评论(0) 推荐(0) 编辑
摘要: 毕业即失业,苦逼的大四狗伤不起哟。 又到了一年一度的秋招了,笔者也在拉勾,智联,boss直聘注册了,投了50份简历,3个面试,然而全挂了。 笔者痛定思痛决定将自己的经历贴出,希望可以帮到要面试的同学。 雨轩恋原创 转载请注明来源 雨轩恋i - 博客园 http://www.cnblogs.com/y 阅读全文
posted @ 2018-11-17 12:24 雨轩恋i 阅读(1255) 评论(8) 推荐(3) 编辑
摘要: linux的基础命令大全 1.shell是系统的用户界面,提供了用户与内核进行交互操作的一种接口(命令解释器) ls -al /bin/sh ls -al /bin/bash 查看这些shell的详细信息 对所有用户进行设置环境: /etc/profile 或者 /etc/bashrc 只对当前用户 阅读全文
posted @ 2018-11-12 21:17 雨轩恋i 阅读(2369) 评论(0) 推荐(0) 编辑
摘要: 这是笔者第一次面试,,乐融集团位于朝阳区朝阳公园的乐融大厦。是下午两点的笔面试,笔者是一点半到的,然后在里面等了会,开始笔试 笔试题并不是太难,就是考的比较宽,因为笔者是校招,所以笔试题出来了数据结构的二叉树知识和先序遍历,中序遍历,后序遍历等等的知识, 还考了进制,以及计算机网络的ip分类,tcp 阅读全文
posted @ 2018-11-10 12:02 雨轩恋i 阅读(1329) 评论(6) 推荐(1) 编辑
摘要: 机器学习的最基础模块就是numpy模块了,而numpy模块中的数组操作又是重中之重,所以我们要把数组的各种方法弄得明明白白的,以下就是数组的一些常用方法 1.创建各种各样的数组: 2.数组的复制等各种操作 3.数组的修改等各种操作 4.数组的组合拼接等等 5.数组的查找,排序,统计 附上GitHub 阅读全文
posted @ 2018-11-07 19:30 雨轩恋i 阅读(13268) 评论(0) 推荐(0) 编辑
摘要: 现在网站大部分都是反爬虫技术,最简单就是加代理,写了一个代理小程序。 可以在自己的爬虫程序中加入这个程序,每次动态的使用代理,将爬虫程序伪装成浏览器,这样就不会被网站禁止了 阅读全文
posted @ 2018-10-30 16:20 雨轩恋i 阅读(2813) 评论(3) 推荐(0) 编辑