随笔分类 - python
摘要:本篇将介绍urllib2的Get和Post方法,更多内容请参考: "python学习指南" urllib2默认只支持HTTP/HTTPS的GET和POST方法 urllib.urlencode() urllib和urllib2都是接受URL请求的相关参数,但是提供了不同的功能。两个最显著的不同如下:
阅读全文
摘要:本篇我们将开始学习如何进行网页抓取,更多内容请参考: "python学习指南" urllib2库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。在Python中有很多库可以用来抓取网页,我们先学习 。 urllib2是Python2.x自带的模块(不需要下载
阅读全文
摘要:本篇将开始介绍Python原理,更多内容请参考: "Python学习指南" 为什么要做爬虫 著名的革命家、思想家、政治家、战略家、社会改革的主要领导人物马云曾经在2015年提到由IT转到DT,何谓DT,DT即数据技术,由数据在推倒人们的衣食住行,当今时代是一个 ,数据从何而来? + : "百度指数"
阅读全文
摘要:HTTP和HTTPS HTTP(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收HTML页面的方法 HTTPS(HyperText Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加
阅读全文
摘要:本篇将介绍Python的迭代,更多内容请参考: "Python学习指南" 简介 在Python中,如果给定一个list或者tuple,我们可以通过 来遍历这个list或者tuple,这种遍历我们称为 (Iteration) 在Python中,迭代是 来完成的,而很多语言比如C或者Java,迭代lis
阅读全文
摘要:本篇将介绍python正则表达式,更多内容请参考: "【python正则表达式】" 什么是正则表达式 正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”
阅读全文
摘要:本篇将介绍Python的列表生成式,更多内容请参考: "Python学习指南" 列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。 举个例子,要生成list 可以用 但是要生成 怎么做?方法一是循环: 但是循环太繁琐,而列表生成式则
阅读全文
摘要:本篇将介绍Python的迭代,更多内容请参考: "Python学习指南" 简介 在Python中,如果给定一个list或者tuple,我们可以通过 来遍历这个list或者tuple,这种遍历我们称为 (Iteration) 在Python中,迭代是 来完成的,而很多语言比如C或者Java,迭代lis
阅读全文
摘要:本篇将介绍Python的切片操作,切片支持的数据类型有列表、字符串、元祖,更多内容请参考: "Python学习指南" 切片是什么? 切片操作符是序列名后跟一个方括号,方括号中有一对可选的数字,并用冒号分隔。注意这与你使用的索引操作符十分相似。记住数是可选的,而冒号是必须的。切片分隔符中的第一个数(冒
阅读全文
摘要:本篇将介绍Python里面的字典,更多内容请参考: "Python学习指南" Python是什么? Python内置了字典 的支持,dict全称dictionary,在其他语言中也称为map,使用键 值对(key value)存储,具有极快的查找速度。 举个例子,假设要根据同学的名字查找对应的成绩,
阅读全文
摘要:本篇主要介绍另一种有序列表叫元祖:tuple。更多内容请参考: "python学习指南" 元祖是什么 tuple和list非常类似,但是tuple一旦初始化就不能修改,比如同样是列出同学的名字 现在,classmates这个tuple不能变了,它没有append()、insert()这样的方法。其他
阅读全文
摘要:本篇文章将介绍python的字符串操作,更多内容请参考: "python学习指南" 一、查看帮助文档 在学习编程语言过程中,不管是python语言还是其它语言时我们都应该学会查看API文档,查看帮助信息,以便我们进行开发使用。 学习python查看文档有两种方式: 1. 下载官方的API文档进行查阅
阅读全文
摘要:本篇将介绍python中的列表,更多内容请参考: "Python学习指南" 一、序列 在python中有六种内建的序列:列表、元祖、字符串、Unicode字符串、buffer对象he xrange对象。 通用序列操作 所有的序列都可以进行某些特定的操作。这些操作包括: 1. 索引(indexing)
阅读全文