摘要: 昨天看到了这篇文章,挺感兴趣的,早就知道python功能很强大,抓取网站信息很方便,一直没有用过,就好好分析了一下,在原作者的基础上修改了一下,也实现了博客园首页信息的提取,主要提取的是关于文章的标题、作者、发布时间、评论、阅读几个属性。获取不同页面的html数据: 1 import os,urllib,sys 2 class LinkParser: 3 def __init__(self,url): 4 self.urls=[url] 5 for i in range(2,10): 6 self.urls.insert(0,ur... 阅读全文
posted @ 2013-08-21 20:47 楠楠IT 阅读(246) 评论(0) 推荐(0) 编辑
摘要: TCP/IP协议时互联网通信的基础,非常重要,根据自己的理解深入浅出的总结一下。首先,IP地址也就是计算机的网络地址,全球唯一,根据IP地址我们能找到联网的任何计算机,IP协议时面向非连接的不可靠的。什么是面向非连接的通信?就是通信之前不需要建立一条通信线路,而是直接向目的计算机发送信息,数据在传送过程中会选择不同的信道。什么是面向连接的通信?就是通信双方在通信前建立一条端到端的通信线路,通信过程始终用该线路传输信息,直到传输结束,通信线路解除,TCP协议正是用的面向连接的方式通信。IP找到了目的计算机,但是通信过程是应用程序之间的通信,所以,TCP(传输控制协议)协议就是负责实现端口到端口的 阅读全文
posted @ 2013-08-21 09:28 楠楠IT 阅读(273) 评论(0) 推荐(0) 编辑