2017年2月26日

正则在重复抓取的情况下一定要分组

摘要: 正则在重复抓取的情况下一定要分组 阅读全文

posted @ 2017-02-26 16:46 andrewleeeeee 阅读(245) 评论(0) 推荐(0) 编辑

Python 出现 can't use a string pattern on a bytes-like object

摘要: # coding=utf-8 import urllib.request import re url = 'http://www.163.com' file = 'd:/test.html' data = urllib.request.urlopen(url).read() r1 = re.comp 阅读全文

posted @ 2017-02-26 16:07 andrewleeeeee 阅读(9732) 评论(0) 推荐(0) 编辑

2017年2月25日

Python3 正则表达式

摘要: 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表 阅读全文

posted @ 2017-02-25 17:15 andrewleeeeee 阅读(257) 评论(0) 推荐(0) 编辑

2017年2月24日

使用 from import方法导入Python模块

摘要: 比如我们导入一个数学计算的模块 math: >>> import math>>> print math<module 'math' (built-in)>>>>>>> print math.pi #导出圆周率的值3.14159265359>>> 我们导入math模块,在python模块学习中我们会知 阅读全文

posted @ 2017-02-24 20:58 andrewleeeeee 阅读(830) 评论(0) 推荐(0) 编辑

Python encode()方法

摘要: 描述 Python encode() 方法以 encoding 指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。 语法 encode()方法语法: 参数 encoding -- 要使用的编码,如"UTF-8"。 errors -- 设置不同错误的处理方案。默认为 'strict 阅读全文

posted @ 2017-02-24 20:28 andrewleeeeee 阅读(257) 评论(0) 推荐(0) 编辑

urllib

摘要: urllib提供了一系列用于操作URL的功能。 Get urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应: 例如,对豆瓣的一个URLhttps://api.douban.com/v2/book/2129650进行抓取,并返回响 阅读全文

posted @ 2017-02-24 20:23 andrewleeeeee 阅读(367) 评论(0) 推荐(0) 编辑

python的urlencode与urldecode

摘要: ```python3.x中urlencode在urllib.parse模块中``` 当url地址含有中文,或者参数有中文的时候,这个算是很正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至'/'做一下编码转换。 一、urlencode urllib库里面有个 阅读全文

posted @ 2017-02-24 19:59 andrewleeeeee 阅读(203) 评论(0) 推荐(0) 编辑

猜数字游戏

摘要: """1、让用户输入数字2、最多只能有5次机会3、没猜对,则提示最新的数字范围4、猜对了则提示成功并退出程序5、用户中途不愿再猜了可以输入exit或者quit退出程序6、需要将用户猜数字的记录写到文件保存""" import random n = 0 num_random = random.randint(0, 100) num_list_min = [0] num_list_max = [... 阅读全文

posted @ 2017-02-24 19:37 andrewleeeeee 阅读(215) 评论(0) 推荐(0) 编辑

Python切片

摘要: 切片操作符是序列名后跟一个方括号,方括号中有一对可选的数字,并用冒号分割。注意这与你使用的索引操作符十分相似。记住数是可选的,而冒号是必须的。 切片操作符中的第一个数(冒号之前)表示切片开始的位置,第二个数(冒号之后)表示切片到哪里结束,第三个数(冒号之后)表示切片间隔数。如果不指定第一个数,Pyt 阅读全文

posted @ 2017-02-24 14:21 andrewleeeeee 阅读(187) 评论(0) 推荐(0) 编辑

python 列表list

摘要: Python 列表(List) 序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。 Python有6个序列的内置类型,但最常见的是列表和元组。 序列都可以进行的操作包括索引,切片,加,乘,检查成员。 此外,Pytho 阅读全文

posted @ 2017-02-24 13:42 andrewleeeeee 阅读(178) 评论(0) 推荐(0) 编辑

导航