会员
商店
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2019年9月14日
http协议
摘要: 什么是http和https协议 http协议:全称是HyperText Transfer Protocol,中文意思是超文本传输协议,是一种发布和接受HTML页面的方法,服务器端口号是80端口。 https协议:是HTTP协议的加密版本,在HTTP下加入了SSL层。服务器端口号是443端口。 在浏览
阅读全文
posted @ 2019-09-14 22:34 Jervey
阅读(433)
评论(0)
推荐(0)
编辑
python爬虫
摘要: 爬虫基础 爬虫前奏 http协议 urllib库 持续更新
阅读全文
posted @ 2019-09-14 22:34 Jervey
阅读(193)
评论(0)
推荐(0)
编辑
2019年9月9日
爬虫前奏
摘要: 爬虫的实际例子 什么是爬虫 1. 通俗理解,爬虫是模拟人请求网站的程序。可以自动请求网页,并将数据抓取下来,然后使用一定的规则提取有价值的数据。 2. 专业介绍:百度百科 通用爬虫和聚焦爬虫 1. 通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互
阅读全文
posted @ 2019-09-09 22:00 Jervey
阅读(181)
评论(0)
推荐(0)
编辑
2019年9月5日
Scrapy 框架的使用
摘要: Scrapy 框架的介绍 Scrapy 是一个基于Twisted的异步处理框架,是纯Python实现的爬虫框架,其架构清晰模块之间的耦合成都低,可扩展性极强,可以灵活完成各种需求。我们只需要定制开发几个模块就可以轻松实现一个爬虫。 1. 架构介绍 它可以分为如下几个部分。 Engine 引擎,处理整
阅读全文
posted @ 2019-09-05 23:09 Jervey
阅读(149)
评论(0)
推荐(0)
编辑
2019年8月14日
mongodb 笔记
摘要: 1、每次启动需要配置启动文件 mongod --dbpath G:\data\db 执行完上面命令再打开一个新的窗口执行 mongo 也可通过后台参数启动mongo: ./mongod -dbpath /data/mongo/ -logpath /data/mongo/mongo.log -loga
阅读全文
posted @ 2019-08-14 09:33 Jervey
阅读(166)
评论(0)
推荐(0)
编辑
2019年8月13日
navicat for mysql 链接时报错:1251-Client does not support authentication protocol requested by server
摘要: 客户端使用navicat for mysql。本地安装了mysql 8.0。但是在链接的时候提示: 主要原因是mysql服务器要求的认证插件版本与客户端不一致造成的。 打开mysql命令行输入如下命令查看,系统用户对应的认证插件: 可以看到root用户使用的plugin是caching_sha2_p
阅读全文
posted @ 2019-08-13 15:22 Jervey
阅读(350)
评论(0)
推荐(0)
编辑
2019年8月1日
Python中常见字符串去除空格的方法总结
摘要: 1:strip()方法,去除字符串开头或者结尾的空格 >>> a = " a b c " >>> a.strip() 'a b c' 2:lstrip()方法,去除字符串开头的空格 >>> a = " a b c " >>> a.lstrip() 'a b c ' 3:rstrip()方法,去除字符
阅读全文
posted @ 2019-08-01 23:14 Jervey
阅读(17173)
评论(0)
推荐(0)
编辑
解析库的使用
摘要: 使用XPath XPath,全称XML Path Language,即XML路径语言,它是一门在xml文档中查找信息的语言。它最初是用来搜寻XML文档的,但是它同样使用于HTML文档的搜索。 所以在做爬虫时,我们完全可以使用XPath来做相应的信息抽取。 XPath 常用规则 表 达 式 描 述 n
阅读全文
posted @ 2019-08-01 21:41 Jervey
阅读(276)
评论(0)
推荐(0)
编辑
UTF-8 中文编码范围
摘要: 主流的匹配字符有两种 [\u4e00-\u9fa5]和[\u2E80-\u9FFF],后者范围更广,包括了日韩地区的汉字
阅读全文
posted @ 2019-08-01 08:39 Jervey
阅读(4494)
评论(0)
推荐(0)
编辑
2019年7月18日
常见User-Agent大全
摘要: window.navigator.userAgent 1) Chrome Win7: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1 2) Firefox Win7: Mozilla/5.0 (Windows NT 6.1;...
阅读全文
posted @ 2019-07-18 10:34 Jervey
阅读(9880)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
下一页
公告
昵称:
Jervey
园龄:
7年2个月
粉丝:
4
关注:
8
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
socket
(1)
python信号
(1)
python contenttypes组件
(1)
python auth认证组件
(1)
python admin
(1)
python
(1)
Django logging配置
(1)
Django 开发调试工具:Django-debug-toolbar
(1)
aggregate和annotate使用
(1)
粘包
(1)
更多
随笔分类
C语言(1)
Python 开发之路(49)
python 爬虫(7)
re(1)
tools(3)
数据库(1)
随笔档案
2022年8月(1)
2022年7月(1)
2022年4月(1)
2021年8月(3)
2021年6月(4)
2019年9月(5)
2019年8月(5)
2019年7月(1)
2019年5月(29)
2019年4月(2)
2018年12月(3)
2018年10月(2)
2018年8月(6)
文章分类
lib(2)
阅读排行榜
1. ajax以及文件上传的几种方式(19129)
2. Python中常见字符串去除空格的方法总结(17173)
3. 常见User-Agent大全(9880)
4. Python3 中 configparser 模块解析配置的用法详解(7246)
5. mysql 修改 添加 删除 表字段(7200)
评论排行榜
1. ajax以及文件上传的几种方式(1)
推荐排行榜
1. Python3 中 configparser 模块解析配置的用法详解(3)
2. mysql 修改 添加 删除 表字段(2)
3. aggregate和annotate使用(1)
4. Form和ModelForm组件(1)
5. Python 开发(1)
最新评论
1. Re:ajax以及文件上传的几种方式
、、、
--threeB
点击右上角即可分享