摘要:
行和缩进: 一个程序员学习Python时,遇到的第一个需要注意的地方是,不使用括号来表示代码的类和函数定义块或流程控制。代码块是由行缩进,这是严格执行表示方式。 在缩进位的数目是可变的,但是在块中的所有语句必须缩进相同的量。在这个例子中,两个功能块都很好使用: if True: print "Tru 阅读全文
摘要:
如果两个变量值相等,出于性能考虑,会使用同一个内存地址,不重复创建。前提是不可变对象。这个比较特殊,我是第一次遇到这种方式。 a = 1b = 1print(id(a)) # 输出1679257056print(id(b)) # 输出1679257056 Dictionary(字典),key和val 阅读全文
摘要:
26、字典dic = {'k1': "v1", "k2": "v2", "k3": [11,22,33]} b. 请循环输出所有的 value c. 请循环输出所有的 key 和 value for i in dic:print(i,dic[i]) d. 请在字典中添加一个键值对,"k4": "v4 阅读全文
摘要:
焦抓取 爬虫所抓取页面的重要程度也可以表述成它与给定查询之间相似程度的函数。网络爬虫尝试下载相似页面,可以称为聚焦检索或者主题检索。关于主题检索和聚焦检索的概念,最早是由Menczer(Menczer 1997; Menczer and Belew, 1998)和Chakrabarti等人首先提出来 阅读全文
摘要:
ython请求数据 基本的HTTP协议知识后,大家可能会疑问那我该如何模仿浏览器或者手机客户端去向服务器发送HTTP请求呢?python的原生库urllib、第三方库requests、pycurl等都支持HTTP协议,既然有这么多工具可以用,大家可能就又有疑问该选择哪个工具了。在此我特地安利大家用一 阅读全文
摘要:
重新访问策略 网络具有动态性很强的特性。抓取网络上的一小部分内容可能会花费真的很长的时间,通常用周或者月来衡量。当爬虫完成它的抓取的任务以后,很多操作是可能会发生的,这些操作包括新建,更新和删除。 从搜索引擎的角度来看,不检测这些事件是有成本的,成本就是我们仅仅拥有一份过时的资源。最常使用的成本函数 阅读全文
摘要:
字符描述 * 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。 + 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。 ? 匹配前面的子表达式零次或一次。例如,"do(es) 阅读全文
摘要:
18、布尔值分别有什么? False .Ture ,或1 和0 20、写代码,有如下变量,请按照要求实现每个功能 name = " aleX"a. 移除 name 变量对应的值两边的空格,并输入移除有的内容 b. 判断 name 变量对应的值是否以 "al" 开头,并输出结果 c. 判断 name 阅读全文