摘要:
一、准备工作与代码实例 1、PIL、pytesser、tesseract (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载) 下载后是一个exe,直接双击安装,它会自动安装到C:\Python27\Lib\site-packag 阅读全文
随笔分类 - Python
12岁的少年教你用Python做小游戏
2016-08-07 14:31 by GarfieldEr007, 589 阅读, 收藏, 编辑
摘要:
你有没有想过电脑游戏是怎样制作出来的?其实它没有你想象的那样复杂!在这个教程里,你要学做一个叫《兔子和獾》的塔防游戏,兔子作为英雄,需要在城堡里抵御獾的进攻。 为了写这个游戏的代码,你将会用Python。好吧,我不是指一条大蟒蛇! Python是一种计算机语言。我们在这篇教程里选择Python是因为 阅读全文
零基础写python爬虫之使用Scrapy框架编写爬虫
2016-06-17 16:49 by GarfieldEr007, 3414 阅读, 收藏, 编辑
摘要:
网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的HTML数据。虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间。Scrapy是一个使用Python编写的,轻量级的,简单轻巧,并且使用起来非常的方便。使用Scrapy可以很方便的完成网上数据的采集工作,它为我 阅读全文
Scrapy爬取美女图片第三集 代理ip(上) (原创)
2016-05-22 18:45 by GarfieldEr007, 427 阅读, 收藏, 编辑
摘要:
首先说一声,让大家久等了。本来打算520那天进行更新的,可是一细想,也只有我这样的单身狗还在做科研,大家可能没心思看更新的文章,所以就拖到了今天。不过忙了521,522这一天半,我把数据库也添加进来了,修复了一些bug(现在肯定有人会说果然是单身狗)。 好了,废话不多说,咱们进入今天的主题。上两篇 阅读全文
Scrapy爬取美女图片续集 (原创)
2016-05-22 18:43 by GarfieldEr007, 517 阅读, 收藏, 编辑
摘要:
上一篇咱们讲解了Scrapy的工作机制和如何使用Scrapy爬取美女图片,而今天接着讲解Scrapy爬取美女图片,不过采取了不同的方式和代码实现,对Scrapy的功能进行更深入的运用。 在学习Scrapy官方文档的过程中,发现Scrapy自身实现了图片和文件的下载功能,不需要咱们之前自己实现图片的下 阅读全文
Scrapy爬取美女图片 (原创)
2016-05-22 18:42 by GarfieldEr007, 523 阅读, 收藏, 编辑
摘要:
有半个月没有更新了,最近确实有点忙。先是华为的比赛,接着实验室又有项目,然后又学习了一些新的知识,所以没有更新文章。为了表达我的歉意,我给大家来一波福利。。。 今天咱们说的是爬虫框架。之前我使用python爬取慕课网的视频,是根据爬虫的机制,自己手工定制的,感觉没有那么高大上,所以我最近玩了玩 py 阅读全文
python实现并行爬虫
2016-04-05 12:32 by GarfieldEr007, 792 阅读, 收藏, 编辑
摘要:
问题背景:指定爬虫depth、线程数, python实现并行爬虫 思路: 单线程 实现爬虫类Fetcher 多线程 threading.Thread去调Fetcher 方法:Fetcher 中,用urllib.urlopen打开指定url,读取信息: 但是这样有问题, 比如对于www.sina.co 阅读全文
python 调用 C++ code
2016-04-05 12:31 by GarfieldEr007, 428 阅读, 收藏, 编辑
摘要:
本文以实例code讲解python 调用 C++的方法。 1. 如果没有参数传递从python传递至C++,python调用C++的最简单方法是将函数声明为C可用函数,然后作为C code被python调用,如这里三楼所示; 2. 有参数传递至C++函数,swig是最便捷的调用方法,以下面这个工程所 阅读全文
python多线程threading
2016-04-05 12:30 by GarfieldEr007, 238 阅读, 收藏, 编辑
摘要:
本文通过 4个example 介绍python中多线程package —— threading的常用用法, 包括调用多线程, 同步队列类Queue, Ctrl+c结束多线程。 example1. 调用10个线程, 分别打印0~4, 每打印一个数pause一秒钟。 code如下所示, 在test()函 阅读全文
简明python教程 --C++程序员的视角(八):标准库
2016-03-15 19:21 by GarfieldEr007, 243 阅读, 收藏, 编辑
摘要:
这个模块包含普遍的操作系统功能。 如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的。一个例子就是使用os.sep可以取代操作系统特定的路径分割符。 >> os.system('ls -l') 也可以使用subprocess模块 >> subprocess.call('ls -l'.sp 阅读全文
简明python教程 --C++程序员的视角(九):函数式编程、特殊类方法、测试及其他
2016-03-15 19:21 by GarfieldEr007, 286 阅读, 收藏, 编辑
摘要:
exec,eval和assert语句,repr函数 用来创建简短的单行匿名函数 lambda需要一个参数,后面仅跟单个表达式作为函数体,而表达式的值被这个新建的函数返回。注意,即便是print语句也不能用在lambda形式中,只能使用表达式。 >>> ftwice = lambda s:s*2 >> 阅读全文
简明python教程 --C++程序员的视角(七):异常
2016-03-15 19:20 by GarfieldEr007, 386 阅读, 收藏, 编辑
摘要:
当你的程序中出现某些 异常的 状况的时候,异常就发生了。例如,当你想要读某个文件的时候,而那个文件不存在。或者在程序运行的时候,你不小心把它删除了。上述这些情况可以使用异常来处理。 假如你的程序中有一些无效的语句,Python会引发并告诉你那里有一个错误,从而处理这样的情况。考虑一个简单的print 阅读全文
简明python教程 --C++程序员的视角(六):输入输出IO
2016-03-15 19:19 by GarfieldEr007, 418 阅读, 收藏, 编辑
摘要:
另一个常用的输入/输出类型是处理文件。创建、读和写文件的能力是许多程序所必需的,我们将会在这章探索如何实现这些功能。 你可以通过创建一个file类的对象来打开一个文件,分别使用file类的read、readline或write方法来恰当地读写文件。对文件的读写能力依赖于你在打开文件时指定的模式。 阅读全文
简明python教程 --C++程序员的视角(五):面向对象的编程
2016-03-15 19:18 by GarfieldEr007, 197 阅读, 收藏, 编辑
摘要:
在大多数时候你可以使用过程性编程,但是有些时候当你想要编写大型程序或是寻求一个更加合适的解决方案的时候,你就得使用面向对象的编程技术。 这些术语帮助我们把它们与孤立的函数和变量区分开来。域和方法可以合称为类的属性。类使用class关键字创建。类的域和方法被列在一个缩进块中。 类的方法与普通的函数 阅读全文
简明python教程 --C++程序员的视角(四):容器类型(字符串、元组、列表、字典)和参考
2016-03-15 19:18 by GarfieldEr007, 332 阅读, 收藏, 编辑
摘要:
Python定义的类型(或对象)层次结构在概念上可以划分为四种类别:简单类型、容器类型、代码类型 和内部类型。 可以将 PyObject 类之下的所有 Python 类划分为 Python 运行时解释器可以使用的四个主要类别: 内置的简单类型 Python 有五个内置的简单类型:bool、int 阅读全文
简明python教程 --C++程序员的视角(三):模块
2016-03-15 19:17 by GarfieldEr007, 468 阅读, 收藏, 编辑
摘要:
1 python程序由包(package)、模块(module)和函数组成。包是由一系列模块组成的集合。模块是处理某一类问题的函数和类的集合。函数是一段可以重复多次调用的代码。 2 python的程序是由一个个模块组成的。模块把一组相关的函数或代码组织到一个文件中,一个文件即是一个模块。模块由代码、 阅读全文
简明python教程 --C++程序员的视角(二):函数及作用域
2016-03-15 19:16 by GarfieldEr007, 243 阅读, 收藏, 编辑
摘要:
函数通过def关键字定义。def关键字后跟一个函数的标识符名称,然后跟一对圆括号。圆括号之中可以包括一些变量名,该行以冒号结尾。接下来是一块语句,它们是函数体。 1 位置:从左往右进行匹配(默认方式) 2 关键字参数:通过参数名进行匹配 func(name = value)3 默认参数:为没有传 阅读全文
简明python教程 --C++程序员的视角(一):数值类型、字符串、运算符和控制流
2016-03-15 19:14 by GarfieldEr007, 367 阅读, 收藏, 编辑
摘要:
在Python中有4种类型的数——整数、长整数、浮点数和复数(Python 有五个内置的简单类型:bool、int、long、float 和 complex)。 在Python中一切皆是对象,如果您不怕麻烦,还可以直接使用它们的构造函数。 在双引号中的字符串与单引号中的字符串的使用完全相同。 阅读全文
探索 Python、机器学习和 NLTK 库 开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类
2016-03-09 21:17 by GarfieldEr007, 370 阅读, 收藏, 编辑
摘要:
挑战:使用机器学习对 RSS 提要进行分类 最近,我接到一项任务,要求为客户创建一个 RSS 提要分类子系统。目标是读取几十个甚至几百个 RSS 提要,将它们的许多文章自动分类到几十个预定义的主题领域当中。客户网站的内容、导航和搜索功能都将由这个每日自动提要检索和分类结果驱动。 客户建议使用机器学习 阅读全文
Matplotlib Tutorial(译)
2016-03-06 20:01 by GarfieldEr007, 418 阅读, 收藏, 编辑
摘要:
Matplotlib Tutorial(译) 翻译自:Matplotlib tutorialNicolas P. Rougier - Euroscipy 2012 toc{: toc} 这个教程基于可以从scipy lecture note得到的 Mike Müller的教程。 源代码可从这里获得。 阅读全文