silence_cho

2018年12月21日

摘要：对于爬取下来的网页进行缓存，可以方便下次访问，无需再次下载。实现过程可以分为两大块，一是实现下载器，二是实现缓存器。 1. 下载器：下载器功能：下载时先查看缓存中是否保存url对应的文件，不存在时再去访问网页端，并将结果加入到缓存中，下载器代码如下：在爬取网页时，使用下载器代码如下： 2. 缓存阅读全文

posted @ 2018-12-21 21:47 silence_cho 阅读(948) 评论(0) 推荐(0) 编辑

2018年12月19日

（一）爬虫之网页下载

摘要： 1，相关知识 robots.txt: 一些网站会定义robots.txt文件（https://www.example.com/robots.txt），规定了网页爬取的相关限制，查看其内容，遵守规则可以避免过早IP被封。下面为知乎robots.txt部分内容（https://www.zhihu.co 阅读全文

posted @ 2018-12-19 19:27 silence_cho 阅读(1343) 评论(0) 推荐(0) 编辑

2018年12月15日

图及其衍生算法（Graphs and graph algorithms）

摘要： 1. 图的相关概念树是一种特殊的图，相比树，图更能用来表示现实世界中的的实体，如路线图，网络节点图，课程体系图等，一旦能用图来描述实体，能模拟和解决一些非常复杂的任务。图的相关概念和词汇如下：顶点vertex：图的节点边Edge：顶点间的连线，若边具有方向时，组成有向图（directed gr 阅读全文

posted @ 2018-12-15 14:33 silence_cho 阅读(1442) 评论(0) 推荐(0) 编辑

2018年12月8日

树及其衍生算法（Trees and tree algorithms）

摘要： 1，二叉树（Binary tree）二叉树：每一个节点最多两个子节点，如下图所示：相关概念：节点Node，路径path，根节点root，边edge，子节点 children，父节点parent，兄弟节点sibling, 子树subtree，叶子节点leaf node, 度level,树高high 阅读全文

posted @ 2018-12-08 13:59 silence_cho 阅读(1645) 评论(0) 推荐(0) 编辑

2018年12月2日

数据结构之链表（Linked list）

摘要： 1, 无序链表（Unordered linked list）链表是有若干个数据节点依次链接成的数据结构，如下图所示，每一个数据节点包括包括数据和一个指向下一节点的指针。（python中的list就是由链表来实现的）无序链表操作： python实现无序链表定义了Node类和UnorderedLi 阅读全文

posted @ 2018-12-02 18:14 silence_cho 阅读(1051) 评论(0) 推荐(0) 编辑

查找与排序算法（Searching adn Sorting）

摘要： 1，查找算法常用的查找算法包括顺序查找，二分查找和哈希查找。 1.1 顺序查找(Sequential search) 顺序查找：依次遍历列表中每一个元素，查看是否为目标元素。python实现代码如下： #无序列表 def sequentialSearch(alist,item): found = 阅读全文

posted @ 2018-12-02 18:11 silence_cho 阅读(1099) 评论(0) 推荐(0) 编辑

2018年11月29日

数据结构之双端队列（Deque）

摘要： 1，双端队列定义双端队列：其两端都可以入列和出列的数据结构，如下图所示，队列后面（rear）可以加入和移出数据，队列前面（front）可以加入和移出数据双端队列操作：操作示例： 2，用python实现双端队列 Deque的代码实现如下： 3，Deque的应用回文检查（Palindrome 阅读全文

posted @ 2018-11-29 21:35 silence_cho 阅读(2408) 评论(0) 推荐(0) 编辑

数据结构之队列（Queue）

摘要： 1，队列的定义队列：是一种先进先出的数据结构，如下图所示，现进去的数据在队列前面（front），先出队列，后进入队列的数据在后面（rear），后出队列。队列常用操作：操作示例： 2，用python实现队列可以用python的list来实现队列，其定义如下面代码所示。（其中enqueue和d 阅读全文

posted @ 2018-11-29 20:40 silence_cho 阅读(1579) 评论(0) 推荐(0) 编辑

2018年11月28日

数据结构之栈（stack）

摘要： 1，栈的定义栈：先进后出的数据结构，如下图所示，先进去的数据在底部，最后取出，后进去的数据在顶部，最先被取出。栈常用操作： s=Stack() 创建栈 s.push(item) 将数据item放在栈的顶部 s.pop() 返回栈顶部数据，并从栈中移除该数据 s.peek() 返回栈顶部数据，但不阅读全文

posted @ 2018-11-28 22:02 silence_cho 阅读(11784) 评论(0) 推荐(0) 编辑

2018年11月26日

WebSocket协议学习

摘要： websocket协议规定了客户端和服务端socket连接和通信时的规则，一是连接握手时的认证，二是通信时的数据报文解析。其整个流程的简单分析如下：（websocket简介参见：https://www.zhihu.com/question/20215561/answer/40316953） 1.w 阅读全文

posted @ 2018-11-26 22:30 silence_cho 阅读(953) 评论(0) 推荐(0) 编辑

公告