01 2018 档案
摘要:import numpy as np import pandas as pd from pandas import Series,DataFrame import numpy as np import pandas as pd from pandas import Series,DataFrame
阅读全文
摘要:登月图片消噪 登月图片消噪 登月图片消噪 登月图片消噪 scipy.fftpack模块用来计算快速傅里叶变换速度比传统傅里叶变换更快,是对之前算法的改进图片是二维数据,注意使用fftpack的二维转变方法 scipy.fftpack模块用来计算快速傅里叶变换速度比传统傅里叶变换更快,是对之前算法的改
阅读全文
摘要:plt.imshow(face_image.mean(axis=2),cmap='gray') 图片灰度处理¶ plt.imshow(face_image.mean(axis=2),cmap='gray') 图片灰度处理¶ plt.imshow(face_image.mean(axis=2),cma
阅读全文
摘要:关于matplotlib学习还是强烈建议常去官方http://matplotlib.org/contents.html里查一查各种用法和toturial等。 下面是jupyter notebook代码导出的md文件。 Plotting and Visualization 1 matplotlib A
阅读全文
摘要:标准的Python中用列表(list)保存一组值,可以当作数组使用。但由于列表的元素可以是任何对象,因此列表中保存的是对象的指针。这样一来,为了保存一个简单的列表[1,2,3],就需 要有三个指针和三个整数对象。对于数值运算来说,这种结构显然比较浪费内存和 CPU 计算时间。 使用numpy的arr
阅读全文
摘要:### 一.创建对象 # 1.可以通过传递一个list对象来创建一个Series,pandas会默认创建整型索引: # s=pd.Series([1,3,5,np.nan,6,8]) # print(s) # # 2.通过传递一个numpy array,时间索引以及列标签来创建一个DataFrame
阅读全文
摘要:朴素贝叶斯是一种十分简单的分类算法,称其朴素是因为其思想基础的简单性,就文本分类而言,他认为词袋中的两两词之间的关系是相互独立的,即一个对象的特征向量中的每个维度都是互相独立的。这是朴素贝叶斯理论的思想基础。 朴素贝叶斯分类的正式定义: 那么关键就是如何计算第三步中的各个条件概率,我们可以这样计算:
阅读全文
摘要:决策树是一个非参数的监督式学习方法,主要用于分类和回归。算法的目标是通过推断数据特征,学习决策规则从而创建一个预测目标变量的模型。如下如所示,决策树通过一系列if-then-else 决策规则 近似估计一个正弦曲线。 决策树优势: 简单易懂,原理清晰,决策树可以实现可视化 数据准备简单。其他的方法需
阅读全文
摘要:1.首先介绍一下:scrapy-redis框架 scrapy-redis:一个三方的基于redis的分布式爬虫框架,配合scrapy使用,让爬虫具有了分布式爬取的功能。github地址: https://github.com/darkrho/scrapy-redis , mongodb 、mysql
阅读全文
摘要:klearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
阅读全文
摘要:最常用的一种方法,利用pandas包 同样pandas也提供简单的读csv方法 另一种方法用csv包,一行一行写入 读取csv文件用reader
阅读全文
摘要:NumPy基本方法 一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等 读取数组元素:如a[0],a[0,0] 数组变形:如b=a.reshape(2,3,4)将得到原数组变为2*3*4的三维数组后的数组;或是a.shape=(
阅读全文
摘要:回归是指利用样本(已知数据),产生拟合方程,从而对(未知数据)进行预测。 用途:预测、判别合理性。 困难:①选定变量(多元);②避免多重共线性;③观察拟合方程,避免过度拟合;④检验模型的合理性。 因变量与自变量的关系:①相关关系(非确定性关系,比如物理与化学成绩相关性),使用相关系数衡量线性相关性的
阅读全文
摘要:一、算法概述1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数据,对于新的数据则直接和训练数据匹配,如果存在相同属性的训练数据,则直接用它的分类来作为新数据的分类。这种方式有一个明
阅读全文
摘要:聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。 不同的簇类型 聚类旨在发现有用的对象簇,在现实中我们用到很多的簇的类型,使用不同的簇类型划分数据的结果是不同的,如下的几种簇类型。 明显分离的 可以看到(a)中不同组中任意两点之间的距离都大
阅读全文
摘要:1、创建项目 在开始爬取之前,您必须创建一个新的Scrapy项目。进入您打算存储代码的目录中,运行新建命令。 例如,我需要在D:\00Coding\Python\scrapy目录下存放该项目,打开命令窗口,进入该目录,执行以下命令: scrapy startproject tutorial PS:t
阅读全文
摘要:学习 Flask,写完一个 Flask 应用需要部署的时候,就想着折腾自己的服务器。根据搜索的教程照做,对于原理一知半解,磕磕碰碰,只要运行起来了,谢天谢地然后不再折腾了,到下一次还需要部署时,这样的过程就会重复一次。不知道多少人的膝盖中箭了呢?我也这样干过,这么做确实很蠢,所以我决定写一篇 Fla
阅读全文
摘要:使用runserver可以使我们的django项目很便捷的在本地运行起来,但这只能在局域网内访问,如果在生产环境部署django,就要多考虑一些问题了。比如静态文件处理,安全,效率等等,本篇文章总结归纳了一下基于uwsgi+Nginx下django项目生产环境的部署 准备条件: 1 2 1.确保有一
阅读全文
摘要:首先考虑使用最简单的方法安装 命令安装,提示 Failed building wheel for Twisted Microsoft Visual C++ 14.0 is required... 于是开始问度娘应该怎样安装,看了几篇博客,虽然和我的问题不十分相同,但是也受到了启发,知道应该怎样解决我
阅读全文
摘要:1、安装查看有没有安装过: yum list installed MySQL* rpm -qa | grep mysql* 查看有没有安装包: yum list mysql* 安装mysql客户端: yum install mysql 安装mysql 服务器端: yum install mysql-
阅读全文