随笔分类 -  Python

摘要:import numpy as np import scipy import time import scipy.sparse as sparse t = [1]+[0]*4999 a = scipy.matrix(np.array(t*5000, dtype=float).reshape(5000 阅读全文
posted @ 2019-05-08 22:33 Kayden_Cheung 阅读(990) 评论(0) 推荐(0) 编辑
摘要:脚本语言的第一行指出用什么程序去执行代码。 #!/usr/bin/python3调用/usr/bin下的python3解释器。#!/usr/bin/env python3首先会到env设置里查找python3的安装路径,再调用对应路径下的解释器程序完成操作。 阅读全文
posted @ 2019-04-23 01:17 Kayden_Cheung 阅读(1204) 评论(0) 推荐(0) 编辑
摘要:在pip安装时,有些库速度及其缓慢从而导致失败,可以通过更改镜像源的方式来安装。 我在安装的时候使用了清华的镜像源,格式如下: 想要安装什么库就在后面替换即可。 阅读全文
posted @ 2019-03-02 16:03 Kayden_Cheung 阅读(785) 评论(0) 推荐(0) 编辑
摘要:正则表达式库re是非常重要的一个库。 首先正则表达式有两种表示类型,一种是raw string类型(原生字符串类型),也就是我们经常看到的r' '的写法,另一种是不带r的写法,称为string类型。raw string的作用是把转义字符当做普通的字符,所以一般来说,我们都是使用raw string类 阅读全文
posted @ 2018-05-25 00:08 Kayden_Cheung 阅读(2432) 评论(1) 推荐(0) 编辑
摘要:参考自:https://blog.csdn.net/weixin_35884839/article/details/79398085 由于需要使用到libsvm,所以开始配这个,所幸一次性就成功了。 1、 官网下载libsvm包。(下载的是最新版本libsvm2.2) 2、 进入libsvm-3.2 阅读全文
posted @ 2018-04-06 15:19 Kayden_Cheung 阅读(971) 评论(0) 推荐(1) 编辑
摘要:基础知识:Excel文件的后缀有xls和xlsx,前者是针对2003版本的,2007及其之后的版本是xlsx。 在python中对于这两种不同后缀的文件有不同的库来处理,对于xls用wlrd、xlwt来完成读写,对于xlsx则用openpyxl来处理,并且openpyxl只能处理xlsx文件。 关于 阅读全文
posted @ 2018-02-04 17:07 Kayden_Cheung 阅读(249) 评论(0) 推荐(0) 编辑
摘要:这个程序的核心思想就是将图片的每种颜色与一个字符形成映射关系,然后用字符来表示该种颜色。 我们可以首先可以获取每个像素点的r,g,b值,然后通过公式: 就可以得到每个像素点的灰度值。 准备好一串字符串,将不同的灰度值与不同的字符进行映射即可。 阅读全文
posted @ 2018-02-02 13:04 Kayden_Cheung 阅读(2158) 评论(0) 推荐(0) 编辑
摘要:第 0012 题: 敏感词文本文件 filtered_words.txt,里面的内容 和 0011题一样,当用户输入敏感词语,则用 星号 * 替换,例如当用户输入「北京是个好城市」,则变成「**是个好城市」。 阅读全文
posted @ 2018-01-26 15:45 Kayden_Cheung 阅读(513) 评论(0) 推荐(0) 编辑
摘要:第 0011 题: 敏感词文本文件 filtered_words.txt,里面的内容为以下内容,当用户输入敏感词语时,则打印出 Freedom,否则打印出 Human Rights。 阅读全文
posted @ 2018-01-26 10:32 Kayden_Cheung 阅读(1042) 评论(0) 推荐(0) 编辑
摘要:第 0007 题: 有个目录,里面是你自己写过的程序,统计一下你写过多少行代码。包括空行和注释,但是要分别列出来。 阅读全文
posted @ 2018-01-26 10:16 Kayden_Cheung 阅读(387) 评论(0) 推荐(0) 编辑
摘要:第 0005 题: 你有一个目录,装了很多照片,把它们的尺寸变成都不大于 iPhone5 分辨率的大小。 这个需要用到os模块,os模块的功能就是可以遍历目录和文件。 介绍一下我下面代码中用到的两个方法:① os.walk() 这个方法会返回一个3元元组,(文件夹所在目录,文件夹下的所有文件夹,文件 阅读全文
posted @ 2018-01-25 10:12 Kayden_Cheung 阅读(327) 评论(0) 推荐(0) 编辑
摘要:这次练习爬 传送门 这贴吧里的美食图片。 如果通过img标签和class属性的话,用BeautifulSoup能很简单的解决,但是这次用一下正则表达式,我这也是参考了该博主的博文:传送门 所有图片的src地址前面都是相同的,所以根据这个就可以筛选出我们想要的图片了。也就是在匹配时不用class属性的 阅读全文
posted @ 2018-01-24 12:33 Kayden_Cheung 阅读(1183) 评论(0) 推荐(0) 编辑
摘要:之前第一次练习爬虫的时候看网上的代码有些会设置headers,然后后面的东西我又看不懂,今天终于知道了原来这东西是用来模拟浏览器上网用的,因为有些网站会设置反爬虫机制,所以如果要获取内容的话,需要使用浏览器上网才可以。 获取headers的方法很简单,首先打开审查元素界面,有个Network选项,点 阅读全文
posted @ 2018-01-24 10:48 Kayden_Cheung 阅读(2718) 评论(0) 推荐(0) 编辑
摘要:首先要解决的就是不同的题目在不同的页上,也就是要实现翻页功能,自动获取所要爬取的地址,通过分析可以得出不同的页面也就是volume=后面的数字不同 所以我们可以用re模块来替换即可: 得到所有URL后就很简单了,写个正则表达式来匹配即可。 阅读全文
posted @ 2018-01-24 09:59 Kayden_Cheung 阅读(741) 评论(0) 推荐(0) 编辑
摘要:第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-) 关于python3的urllib模块,可以看这篇博客:传送门 首先是用urlopen打开网站并且获取网页内容,通过查看网页源代码,可以很容易的发现图片的格式都是差不多的,所以用正则表达式来匹配即可。 之后 阅读全文
posted @ 2018-01-23 20:57 Kayden_Cheung 阅读(409) 评论(0) 推荐(0) 编辑
摘要:在学习python的过程中,我越来越感觉到python2和python3之间有很多不同点,最近发现的一点就是编码问题。 在代码清单14-1和14-2中,因为作者是用python2来写得,然后我是用python3来写得,发现就会出现一些问题。 这句代码会出现这样一个错误: 它要求发送的是二进制数据而不 阅读全文
posted @ 2018-01-19 17:23 Kayden_Cheung 阅读(476) 评论(0) 推荐(0) 编辑
摘要:这个项目比较简单,介绍了ReportLab的用法。 首先要用到的是画折线类,PolyLine,用法很简单,看下面的例子: 这儿需要注意的一点是书上的写法是: 但是在python3中这样写是错误的,会有 TypeError: object of type 'zip' has no len() 错误。可 阅读全文
posted @ 2018-01-16 16:33 Kayden_Cheung 阅读(350) 评论(0) 推荐(0) 编辑
摘要:第 0010 题: 使用 Python 生成类似于下图中的字母验证码图片 阅读全文
posted @ 2018-01-15 16:03 Kayden_Cheung 阅读(237) 评论(0) 推荐(0) 编辑
摘要:接触的第一个python项目,老实说,这个好像并不容易啊,加之对python的不熟悉,确实是搞了很久。 文本文档内容如下: 1 Welcome to World Wide Spam, Inc 2 3 4 These are the corporate web pages of *World Wide 阅读全文
posted @ 2018-01-15 15:01 Kayden_Cheung 阅读(291) 评论(0) 推荐(0) 编辑
摘要:第 0000 题: 将你的 QQ 头像(或者微博头像)右上角加上红色的数字,类似于微信未读信息数量那种提示效果。 类似于图中效果 python中的pillow库是专门用于处理图像的。 阅读全文
posted @ 2018-01-14 11:08 Kayden_Cheung 阅读(767) 评论(0) 推荐(0) 编辑

//目录
点击右上角即可分享
微信分享提示