DAY4-集合,Json方法和函数

补充的文件处理知识:

1. 文件的缓冲区


2.文件会在文件被处理完毕以后被自动关闭掉, 如果需要打开2个文件,代码如下

3.文件修改:将note.txt里的123全换成Python

但是应用这种模式的话,除非知道该行有多长,否则不会完全改对,如上改成'a',它的结果则为:

niuhangyang,a45

liuliu,a,123

此处的第二行并不是我们所需要的结果,这是因为修改过后的内容为liuliu,a,而原有内容为liuliu,123,string长度和原来的不一样,它只会修改前面的部分,而原有后面的部分保留了

为了做比较完美的文件修改操作,有如下两种方式:

  • 简单粗暴的方式

# 1) 先获取文件的所有内容
# 2) 然后修改内容
# 3) 清空原有文件所有的内容
# 4) 重新写入

  • 高效的修改方式

# 1) 先打开原来的文件,再打开一个空文件
# 2) 处理原来文件里面的每一行数据,处理完以后写到新文件里面
# 3) 把原来的文件删掉,把新文件的名字改成原来文件的名字

4. 一个例子

有一个log文件,大致格式如下:

178.210.90.90 - - [04/Jun/2017:03:44:13 +0800] "GET /wp-includes/logo_img.php HTTP/1.0" 302 161 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
178.210.90.90 - - [04/Jun/2017:03:44:13 +0800] "GET /blog HTTP/1.0" 301 233 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
178.210.90.90 - - [04/Jun/2017:03:44:15 +0800] "GET /blog/ HTTP/1.0" 200 38278 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
66.249.75.29 - - [04/Jun/2017:03:45:55 +0800] "GET /bbs/forum.php?mod=forumdisplay&fid=574&filter=hot HTTP/1.1" 200 17482 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "-"我们需要做的是:

监控日志
# 1) 如果一分钟之内某个IP访问超过100次
# 2) 就把他的IP拿出来,然后加入黑名单
# 3) 找到所有的IP,统计次数
# 4) 判断每个IP次数大于100,就发邮件
# 5) 记录文件指针,给下次读的时候用
# 6) 等待60s,重新读取文件

 

PYTHON里的集合COLLECTION

1.python里集合的特性:天生去重,集合是用{}表示
2. 因为都是用{}进行定义,所以需要分辨集合和字典,字典是没有k:v的组合的,如果d1={}定义的是空的字典,如果要定义空的集合:null_set = set()

对集合进行转换:

3. 针对集合,有以下几种操作

1)求合集,交集,对称差集等:

2)增加,或者删除集合内元素操作:

 

JSON方法

1. json实际上json是一个字符串,不过是长的像字典,但是json内只能用双引号,不能使用单引号

2. json方法:

1) 将json串转成字典

2) 将一个json格式的文件转成dict

3)将dict转成json字符串

4)自动帮你写入文件,不需要自己再write,Indent用来自动缩进调整Json格式,后面的数字代表缩进多少。

PYTHON的函数

1. 函数就是一个功能,一个方法,简化代码。函数名不能以数字开头

 

name为函数的参数.此处为形参,形式参数,实际上就是变量

name为必填参数,通过gender='男'可以给gender一个默认值

2. 函数必须要调用才能执行
'xiaohei'为实参,实际参数
可以不填gender,则会将默认值传入进去

3. 在函数里面的变量全都是局部变量,它只能在函数里面使用,函数执行结束就没有这个变量了

如果需要用到函数的处理结果的话,就写return,否则就不用写

4. 函数里面如果遇到return,函数立即结束

对待函数,注意:

#一个函数只做一件事
#重复的代码就是低级的
#实现同样的功能,代码越少越好

4. 例子:

 

 

 

 

 

 

 

 

 

 


posted @ 2018-06-10 21:11  yonniayang  阅读(324)  评论(0编辑  收藏  举报