07 2017 档案
摘要:2017-07-31 18:20:59 一、map函数 map():会根据提供的函数对指定序列做映射。第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的iterator,即迭代器,使用list函数可以将之转成列表。 map
阅读全文
摘要:2017-07-30 19:44:25 什么叫“多任务”呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着,只是桌面上没有显示而已。 现在,多核CPU已经
阅读全文
摘要:2017-07-31 16:22:42 Python提供了time库可以格式化输出时间。 简单讲下其中常用的函数: time.time():用于获取当前时间戳。每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。时间间隔是以秒为单位的浮点小数。 time.ctime():可以获取当
阅读全文
摘要:2017-07-30 22:26:19 随机函数random库的使用频率还是蛮高的,下面我就介绍一下python中random库的使用。相较于c++,Python的random库简直不要更好用。 毫无疑问,使用前需要导入random库,即import random。然后就可以尽情使用了。 Pytho
阅读全文
摘要:(12)的数据类型为int,如果要表示元组,必须加上逗号,即(12,) python 函数的参数传递: 不可变类型:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本
阅读全文
摘要:2017-07-29 23:20:24 主要技术路线:requests+bs4+格式化输出
阅读全文
摘要:2017-07-29 22:54:28 在python中迭代器是指可以通过next()函数不断获得下一个数值的对象,生成器就是迭代器,list,set等是可迭代对象,不是迭代器,可以通过iter()函数来的到其迭代器。 一、迭代器 我们已经知道,可以直接作用于for循环的数据类型有以下几种: 一类是
阅读全文
摘要:2017-07-29 22:03:07 一、使用格式符%进行格式控制 %[(name)][flags][width].[precision]typecode (name):命名 flags:可以有+,-,' '或0。+表示右对齐。-表示左对齐。' '为一个空格,表示在正数的左侧填充一个空格,从而与负
阅读全文
摘要:2017-07-27 13:52:08 一、正则表达式的概念 (1)正则表达式是用来简洁表达一组字符串的表达式,最主要应用在字符串匹配中。 正则表达式是用来简洁表达一组字符串的表达式 正则表达式是一种通用的字符串表达框架 正则表达式是一种针对字符串表达“简洁”和“特征”思想的工具 正则表达式可以用来
阅读全文
摘要:2017-07-26 23:53:03 信息标记的作用有: 标记后的信息可形成信息组织结构,增加了信息维度 标记的结构与信息一样具有重要价值 标记后的信息可用于通信、存储或展示 标记后的信息更利于程序理解和运用 信息标记的三种形式: XML JSON YAML 一、XML xml 的表达格式: 实例
阅读全文
摘要:2017-07-26 10:10:11 Beautiful Soup可以解析html 和 xml 格式的文件。 Beautiful Soup库是解析、遍历、维护“标签树”的功能库。使用BeautifulSoup库非常简单,只需要两行代码,就可以完成BeautifulSoup类的创建,这里命名为sou
阅读全文
摘要:2017-07-25 22:49:21
阅读全文
摘要:2017-07-25 21:08:16 一、网络爬虫的规模 二、网络爬虫的限制 • 来源审查:判断User‐Agent进行限制 检查来访HTTP协议头的User‐Agent域,只响应浏览器或友好爬虫的访问• 发布公告:Robots协议 告知所有爬虫网站的爬取策略,要求爬虫遵守 三、Robots 协议
阅读全文
摘要:2017-07-25 10:38:30 response = requests.get(url, params=None, **kwargs) url : 拟获取页面的url链接∙ params : url中的额外参数,字典或字节流格式,可选 params参数是字典或字节序列,作为参数增加到url中
阅读全文
摘要:2017-07-24 22:58:16 xml 和 json 都是数据交互的格式。 想象一下,python中的字典数据要传给java使用,但是众所周知的是java中只有hashmap数据结构,并没有字典,所以在传输时需要对python中的数据进行序列化操作,就是讲字典数据转成xml或者json格式,
阅读全文
摘要:2017-07-24 22:39:14 Python3 中的beautifulsoup引入的包是bs4
阅读全文
摘要:2017-07-24 20:43:49 Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求。Http协议主要的操作流程是request-response即请求响应。我们可以利用python中的socket库完成连接的建立,然后使用GET方法获取服务器端的数据。 一、
阅读全文
摘要:2017-07-21 15:22:05 Matplotlib库是一个优秀的python的数据可视化的第三方类库,其中的pyplot支持了类似matlab的图像输出操作。matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。 一、matplotlib.pyplot子库 x
阅读全文
摘要:2017-07-24 13:16:17 正则表达式是用来更简洁的匹配查找字符串的一种语言。使用正则表达式可以更方便的处理字符串。在Python中使用re库可以进行字符串的正则匹配。正则表达式本身其实就是一个字符串,不过这个字符串里有一些语法,通过这些语法的约束,可以像解迷一样将字符串中自己需要的部分
阅读全文
摘要:2017-07-20 15:18:25 k近邻(k-Nearest Neighbour, 简称kNN)学习是一种常用的监督学习方法,其工作机制非常简单,对某个给定的测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个‘邻居’的信息进行预测。一般来说,在分类中采用‘投票法’,
阅读全文
摘要:2017-07-03 23:26:08 1、.replace(self, old, new, count=-1) replace()函数将旧字符串替换为新字符串,最后一个参数count为可选项,表示替换最多count次(小于count)。 注意这种替换返回替换后的字符串,源字符串是不改变的。 2、.
阅读全文
摘要:2017-07-09 20:42:55 遍历二叉树的主流方法有三种,分别是前序遍历,中序遍历,后序遍历。 通常使用递归的算法进行遍历,这种遍历的代码编写简单,容易实现。不过,函数递归使用的函数栈,所以,一般这样的问题都可以用自定义的栈来替代递归函数。 1、前序遍历 前序遍历是指中间节点优先于左右两个
阅读全文

浙公网安备 33010602011771号