摘要:
1. 问题 使用 python requests 库的 get 方法抓取豆瓣电影top 250,结果返回的是 None,打印状态码看到的是 418 >>> import requests >>> r = requests.get('https://movie.douban.com/top250') 阅读全文
摘要:
最近在用 Python 写爬虫,爬取 豆瓣电影Top250 的相关数据,需要快速提取页面中用到的数据,因此使用了 Beautiful Soup 这个 Python 库,以下为学习笔记。 1. 为什么使用 Beautiful Soup? 使用 Python 将网页的数据爬取下来后,如何在爬取到的数据中 阅读全文
摘要:
计算机的应用领域极其广泛,但不论其应用在什么地方,信息在机器内部的形式都是一样的,即均为 0 和 1 组成的各种编码。 一 概念 在计算机中参与运算的数有两大类:无符号数和有符号数。 (一) 无符号数 计算机中的数均放在寄存器中,通常称寄存器的位数为机器字长。 所谓无符号数,即没有符号的数,在寄存器 阅读全文
摘要:
在计算机中,小数点不用专门的器件表示,而是按约定的方式标出,共有两种方法表示小数点的存在,即 定点表示 和 浮点表示。 定点表示的数称为定点数。 浮点表示的数称为浮点数。 (一) 定点表示 小数点固定在某一位置的数为定点数。 计算机中,采用定点数的机器称为定点机。 在定点机中,由于小数点的位置固定不 阅读全文
摘要:
我们人类最习惯的计数制是 十进制。 计算机是由具有两种状态的开关器件组成的,因此用 0 和 1 分别可以表示这两种不同的状态,因此计算机最习惯的计数制就是 二进制。 1. 十进制 十进制的特点: 以十为底,逢十进一 共有 0~9 是个数字符号,使用 D(decimal)来表示 2. 二进制 二进制的 阅读全文
摘要:
本人使用打开 PDF 的软件为 Adobe Acrobat Pro DC。 1. 乱码出现的原因: PDF 中嵌入了字体,而PDF中嵌入的字体在个人的电脑字体库中不存在,因此当复制粘贴到文本编辑器中,将无法识别其编码,也就无法解码,从而产生了乱码。 2. 乱码的解决方案: (1) 方案一:下载字体 阅读全文
摘要:
Markdown 是一种轻量级的「标记语言」,它的基本语法非常简明,常用的标记符号大致十来个,因此学习成本很低,而且当你熟悉了这种语法规则,那么将有一劳永逸的效果。 1. Markdown 的优点 语法简明、学习成本低,学成后将终身受用 纯文本内容,能保证在任何平台,打开来都是同样的格式 代码高亮 阅读全文