摘要: list函数: 功能:将字符创转化为列表,例: 列表基本函数: 1.元素赋值,例: 注意:通过list[0]= 'hel',如果原来位置上有值,会覆盖掉原来的。 2.分片操作 1)显示序列,例: 注意:(1)list1[beg:end]将显示列表的从list1[beg]到list1[end-1]的元 阅读全文
posted @ 2017-02-16 09:50 叮了咣当 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。 一个循环 在C语言等其他语言中,for循环一般是这样的 如果python也这么写,那么真该看下python的基础教程了~ 但要注意的是,需要加一个[]来,否则会报错... 在上面的 阅读全文
posted @ 2017-02-16 09:48 叮了咣当 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 二分法是一种快速查找的方法,时间复杂度低,逻辑简单易懂,总的来说就是不断的除以2除以2... 例如需要查找有序数组arr里面的某个关键字key的位置,那么首先确认arr的中位数或者中点center,下面分为三种情况: 1 2 3 假如arr[center]>key,说明key在arr中心左边范围; 阅读全文
posted @ 2017-02-16 08:56 叮了咣当 阅读(10573) 评论(2) 推荐(0) 编辑
摘要: Python所有的内置函数 Built-in Functions abs() divmod() input() open() staticmethod() all() enumerate() int() ord() str() any() eval() isinstance() pow() sum( 阅读全文
posted @ 2017-02-14 08:07 叮了咣当 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 线程(线程锁、threading.Event、queue 队列、生产者消费者模型、自定义线程池) 进程(数据共享、进程池) 协程 Threading用于提供线程相关的操作。线程是应用程序中工作的最小单元,它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中 阅读全文
posted @ 2017-02-09 09:24 叮了咣当 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 1. 线程基础 1.1. 线程状态 线程有5种状态,状态转换的过程如下图所示: 1.2. 线程同步(锁) 多线程的优势在于可以同时运行多个任务(至少感觉起来是这样)。但是当线程需要共享数据时,可能存在数据不同步的问题。考虑这样一种情况:一个列表里所有元素都是0,线程"set"从后向前把所有元素改成1 阅读全文
posted @ 2017-02-09 08:50 叮了咣当 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 在前面的四篇文章中, 我们一直采用 python 3 自带的 urllib 模块来抓取网页, 然后用 re 模块来处理抓取到的数据. 这次我们使用 Requests 库来代替 urllib, 用 BeautifulSoup 来代替 re 模块. 对于这两个模块来说, 学习使用它们的最好方法是看官方文 阅读全文
posted @ 2017-02-08 10:41 叮了咣当 阅读(511) 评论(0) 推荐(0) 编辑
摘要: 今天的工作很有意思, 我们用 Python 来登录网站, 用Cookies记录登录信息, 然后就可以抓取登录之后才能看到的信息. 今天我们拿知乎网来做示范. 为什么是知乎? 这个很难解释, 但是肯定的是知乎这么大这么成功的网站完全不用我来帮他打广告. 知乎网的登录比较简单, 传输的时候没有对用户名和 阅读全文
posted @ 2017-02-08 10:37 叮了咣当 阅读(277) 评论(0) 推荐(0) 编辑
摘要: 上一次我自学爬虫的时候, 写了一个简陋的勉强能运行的爬虫alpha. alpha版有很多问题. 比如一个网站上不了, 爬虫却一直在等待连接返回response, 不知道超时跳过; 或者有的网站专门拦截爬虫程序, 我们的爬虫也不会伪装自己成为浏览器正规部队; 并且抓取的内容没有保存到本地, 没有什么作 阅读全文
posted @ 2017-02-08 10:13 叮了咣当 阅读(278) 评论(0) 推荐(1) 编辑
摘要: 这一回, 开始用Python将伪代码中的所有部分实现. 由于文章的标题就是"零基础", 因此会先把用到的两种数据结构队列和集合介绍一下. 而对于"正则表达式"部分, 限于篇幅不能介绍, 但给出我比较喜欢的几个参考资料. Python的队列 在爬虫程序中, 用到了广度优先搜索(BFS)算法. 这个算法 阅读全文
posted @ 2017-02-08 09:34 叮了咣当 阅读(332) 评论(0) 推荐(0) 编辑