上一页 1 2 3 4 5 6 7 8 9 10 ··· 37 下一页
摘要: 验证码识别是一个适合入门机器学习的项目,之前用knn 做过一个很简单的,这次用svm来实现。svm直接用了开源的库libsvm。验证码选的比较简单,代码也写得略乱,大家看看就好。 1. 爬取验证码图片 2. 二值化 接下来要做的工作就是二值化验证码,所谓二值化,就是将每一个像素点用0或1来表示,图像 阅读全文
posted @ 2018-04-07 14:07 Kayden_Cheung 阅读(6253) 评论(0) 推荐(1) 编辑
摘要: 参考自:https://blog.csdn.net/weixin_35884839/article/details/79398085 由于需要使用到libsvm,所以开始配这个,所幸一次性就成功了。 1、 官网下载libsvm包。(下载的是最新版本libsvm2.2) 2、 进入libsvm-3.2 阅读全文
posted @ 2018-04-06 15:19 Kayden_Cheung 阅读(964) 评论(0) 推荐(1) 编辑
摘要: 内容参考自:https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit 用像素点的rgb值来判断图片的分类准确率并不高,但是作为一个练习knn的题目,还是挺不错的。 1. CIFAR-10 CIFAR-10是一个图像分类数据集。数据集包含6 阅读全文
posted @ 2018-04-05 15:50 Kayden_Cheung 阅读(2389) 评论(0) 推荐(0) 编辑
摘要: 1 #coding = utf-8 2 from http.server import BaseHTTPRequestHandler, HTTPServer 3 4 class RequestHandler(BaseHTTPRequestHandler): 5 Page = ''' 6 <html> 阅读全文
posted @ 2018-03-05 20:36 Kayden_Cheung 阅读(3868) 评论(0) 推荐(0) 编辑
摘要: http://acm.hdu.edu.cn/showproblem.php?pid=3401 题意:有一个股市,现在有T天让你炒股,在第i天,买进股票的价格为APi,卖出股票的价格为BPi,同时最多买进股票的数量为ASi,卖出股票的数量为BSi。一次交易之后要隔W天之后才能再次交易,并且手上最多持股 阅读全文
posted @ 2018-02-20 16:16 Kayden_Cheung 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 这个玩意和改进约会网站的那个差不多,它是提前把所有数字转换成了32*32像素大小的黑白图,然后转换成字符图(用0,1表示),将所有1024个像素点用一维矩阵保存下来,这样就可以通过knn计算欧几里得距离来得到最接近的答案。 阅读全文
posted @ 2018-02-13 23:19 Kayden_Cheung 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 示例背景: 示例背景: 我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现曾交往过三种类型的人: (1)不喜欢的人; (2)魅力一般的人; (3)极具魅力的人; 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象 阅读全文
posted @ 2018-02-12 20:43 Kayden_Cheung 阅读(1231) 评论(0) 推荐(1) 编辑
摘要: 看了这本书的第一个算法—k-近邻算法,这个算法总体构造思想是比较简单的,在ACM当中的话就对应了kd树这种结构。首先需要给定训练集,然后给出测试数据,求出训练集中与测试数据最相近的k个数据,根据这k个数据的属性来确定我们测试数据的属性。 书上的例子是给了四个点以及这四个点的标签,分别是A,A,B,B 阅读全文
posted @ 2018-02-10 14:14 Kayden_Cheung 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 基础知识:Excel文件的后缀有xls和xlsx,前者是针对2003版本的,2007及其之后的版本是xlsx。 在python中对于这两种不同后缀的文件有不同的库来处理,对于xls用wlrd、xlwt来完成读写,对于xlsx则用openpyxl来处理,并且openpyxl只能处理xlsx文件。 关于 阅读全文
posted @ 2018-02-04 17:07 Kayden_Cheung 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 这个程序的核心思想就是将图片的每种颜色与一个字符形成映射关系,然后用字符来表示该种颜色。 我们可以首先可以获取每个像素点的r,g,b值,然后通过公式: 就可以得到每个像素点的灰度值。 准备好一串字符串,将不同的灰度值与不同的字符进行映射即可。 阅读全文
posted @ 2018-02-02 13:04 Kayden_Cheung 阅读(2138) 评论(0) 推荐(0) 编辑
摘要: 第 0012 题: 敏感词文本文件 filtered_words.txt,里面的内容 和 0011题一样,当用户输入敏感词语,则用 星号 * 替换,例如当用户输入「北京是个好城市」,则变成「**是个好城市」。 阅读全文
posted @ 2018-01-26 15:45 Kayden_Cheung 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 第 0011 题: 敏感词文本文件 filtered_words.txt,里面的内容为以下内容,当用户输入敏感词语时,则打印出 Freedom,否则打印出 Human Rights。 阅读全文
posted @ 2018-01-26 10:32 Kayden_Cheung 阅读(1037) 评论(0) 推荐(0) 编辑
摘要: 第 0007 题: 有个目录,里面是你自己写过的程序,统计一下你写过多少行代码。包括空行和注释,但是要分别列出来。 阅读全文
posted @ 2018-01-26 10:16 Kayden_Cheung 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 第 0005 题: 你有一个目录,装了很多照片,把它们的尺寸变成都不大于 iPhone5 分辨率的大小。 这个需要用到os模块,os模块的功能就是可以遍历目录和文件。 介绍一下我下面代码中用到的两个方法:① os.walk() 这个方法会返回一个3元元组,(文件夹所在目录,文件夹下的所有文件夹,文件 阅读全文
posted @ 2018-01-25 10:12 Kayden_Cheung 阅读(324) 评论(0) 推荐(0) 编辑
摘要: 这次练习爬 传送门 这贴吧里的美食图片。 如果通过img标签和class属性的话,用BeautifulSoup能很简单的解决,但是这次用一下正则表达式,我这也是参考了该博主的博文:传送门 所有图片的src地址前面都是相同的,所以根据这个就可以筛选出我们想要的图片了。也就是在匹配时不用class属性的 阅读全文
posted @ 2018-01-24 12:33 Kayden_Cheung 阅读(1175) 评论(0) 推荐(0) 编辑
摘要: 之前第一次练习爬虫的时候看网上的代码有些会设置headers,然后后面的东西我又看不懂,今天终于知道了原来这东西是用来模拟浏览器上网用的,因为有些网站会设置反爬虫机制,所以如果要获取内容的话,需要使用浏览器上网才可以。 获取headers的方法很简单,首先打开审查元素界面,有个Network选项,点 阅读全文
posted @ 2018-01-24 10:48 Kayden_Cheung 阅读(2709) 评论(0) 推荐(0) 编辑
摘要: 首先要解决的就是不同的题目在不同的页上,也就是要实现翻页功能,自动获取所要爬取的地址,通过分析可以得出不同的页面也就是volume=后面的数字不同 所以我们可以用re模块来替换即可: 得到所有URL后就很简单了,写个正则表达式来匹配即可。 阅读全文
posted @ 2018-01-24 09:59 Kayden_Cheung 阅读(737) 评论(0) 推荐(0) 编辑
摘要: 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-) 关于python3的urllib模块,可以看这篇博客:传送门 首先是用urlopen打开网站并且获取网页内容,通过查看网页源代码,可以很容易的发现图片的格式都是差不多的,所以用正则表达式来匹配即可。 之后 阅读全文
posted @ 2018-01-23 20:57 Kayden_Cheung 阅读(404) 评论(0) 推荐(0) 编辑
摘要: 在学习python的过程中,我越来越感觉到python2和python3之间有很多不同点,最近发现的一点就是编码问题。 在代码清单14-1和14-2中,因为作者是用python2来写得,然后我是用python3来写得,发现就会出现一些问题。 这句代码会出现这样一个错误: 它要求发送的是二进制数据而不 阅读全文
posted @ 2018-01-19 17:23 Kayden_Cheung 阅读(473) 评论(0) 推荐(0) 编辑
摘要: 这个项目比较简单,介绍了ReportLab的用法。 首先要用到的是画折线类,PolyLine,用法很简单,看下面的例子: 这儿需要注意的一点是书上的写法是: 但是在python3中这样写是错误的,会有 TypeError: object of type 'zip' has no len() 错误。可 阅读全文
posted @ 2018-01-16 16:33 Kayden_Cheung 阅读(343) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 37 下一页
//目录