摘要:
1 . 前言 PIL 是 Python Image Library 的简称。 PIL 库中提供了诸多用来处理图片的模块,可以对图片做类似于 PS(Photoshop) 的编辑。比如:改变图像大小、旋转图像、图像格式转换,转换颜色通道,图像增强,直方图处理,插值和滤波等等。 PIL 是第三方库,使用之 阅读全文
摘要:
1. 前言 第一次接触 Python 语言的 IO API 时,是惊艳的。相比较其它语言所提供的 IO 流 API 。 无论是站在使用者的角度还是站在底层设计者的角度,都可以称得上无与伦比。 很多人在学习 JAVA 语言中的 IO 流 API 时,几乎是崩溃的。其 API 太多、API 之间的关系过 阅读全文
摘要:
1. 前言 学习爬虫,最好的方式就是自己编写爬虫程序。 爬取目标网站上的数据,理论上讲是简单的,无非就是分析页面中的资源链接、然后下载、最后保存。 但是在实施过程却会遇到一些阻碍。 很多网站为了阻止爬虫程序爬取数据,会对资源路径进行加密、或隐藏等保护操作。 编写爬虫程序的第一关键逻辑就解析资源路径。 阅读全文
摘要:
1. 概念 爬虫不是动物,而是一种计算机程序。 这种程序有自己特定的功能,能按照使用者给定的一系列规则自行浏览万维网并获取需要的信息。此类程序被称为 网络爬虫(web crawler) 或 网络蜘蛛(spider)。 它具有智能分析能力,也称为 机器人程序 。 爬虫的应用应用领域: 如百度、谷歌等以 阅读全文
摘要:
1 . 概念 1.1 真、伪随机数 大部分的计算机语言都会提供 API 生成随机数,此类 API 称为随机数生成器。 计算机可以用随机数模拟现实世界中的各种随机概率问题,没有随机生成器的编程语言不是“好语言”。 什么是真随机数? 现实世界中的随机数:比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变 阅读全文