08 2017 档案
摘要:一、Numpy的ndarray:一种多维数组 ndarray是一个通用的同构多维数据容器,其所有元素必须是相同的类型。每个数组都有一个shape(一个表示各维度的元组)和dtype(一个用于说明数据数据类型的对象)。 创建ndarray 接受一切序列型对象,然后产生一个新的包含有传入数据的Numpy
阅读全文
摘要:一、准备工具 二、安装 执行安装,选择不联网安装。序列号在~/crack/FIK文件中。安装完成后,将~/crack/libmwservices.so文件复制到安装目录中的~/Matlab/bin/glnxa64文件中,最好使用命令复制: 三、激活 首次运行matlab要root权限(否则无法写文件
阅读全文
摘要:上次只是爬取一个专辑的图片,这次要爬取一整个页面的所有专辑的图片。 在上次的代码的基础上进行修改就行了,从专辑的索引页面开始,爬取该页面上所有的专辑的链接,再套用上次的代码就行了。 若要爬取多个页面只需在外围套上一个循环就可以了。 代码如下:
阅读全文
摘要:这次爬取的目标是:美桌网首页 > 桌面壁纸 > 卡通动漫 类别下的壁纸. 我们先随机选取一个专辑来爬( http://www.win4000.com/wallpaper_detail_54520.html ). 后面再把整个卡通动漫类别的所有专辑的壁纸爬下来。 代码如下: 注:如果是Windows下
阅读全文
摘要:一、如何使用命令将本地项目上传到git 进入项目文件夹,通过 git init 命令把这个项目变成git可以管理的仓库 把文件点加到版本库中,使用 git add .添加到暂存区去 用命令 git commit -m '说明' 把文件提交到仓库 关联到远程库 git remote add origi
阅读全文
摘要:一、Requests模块:用于发送网络请求 使用requests方法后,会返回一个response对象,其存储了服务器响应的内容: 1.传递参数: Requests允许你使用params关键字参数,以一个字符串字典来提供参数以手工构建URL 2.定制请求头: 如果你想为请求添加HTTP头部,只要简单
阅读全文
摘要:正则表达式是一种匹配模式,使用的好的话能省去很多的麻烦,而且匹配的精度要比BeautifulSoup高很多。 下面这张图列出了使用正则表达式的一些应该注意的基础问题。
阅读全文
摘要:一、将一段文档传入BeautifulSoup的构造方法,得到一个文档的对象: 二、Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comme
阅读全文
摘要:一、将源更换为国内的源,这样下载和更新软件的速度会快很多。将/etc/apt/sources.list文件的内容更换为如下: 二、更新软件源,运行下面的两个命令: 三、安装搜狗输入法: 1、首先要安装fcitx: 2、然后去搜狗输入法的官网下载Ubuntu版本的的搜狗输入法:http://pinyi
阅读全文
摘要:爬取电影票房数据,用于统计建模分析。目标网站为电影票房数据库(http://58921.com/alltime). 基本的爬取静态网站的技术,模拟登陆使用的是最简单的cookies。(这种模拟登陆的方式虽然简单但有很大的局限性,时效性比较短,也许两三天后就失效了,或者网页改版一点也会导致失效。最好的
阅读全文