摘要:
1 import pandas as pd 2 import numpy as np 3 s = pd.Series([1, 3, 6, np.nan, 44, 1]) 4 5 df= pd.DataFrame(np.random.random((4,5))) 6 7 # data frame 常用属性 8 df.dtypes 9 df.index 10... 阅读全文
2017年2月2日
2017年2月1日
摘要:
1 import numpy as np 2 # 基础属性 3 array = np.array([[[1,2,3], [0,0,1]], [[1,2,3], [0,0,1]]], 4 dtype = np.int64) 5 6 print(array) 7 print(array.ndim) # number of dim 8 print(... 阅读全文
2016年12月22日
摘要:
安装过程下碰了不少坑,记录一下安装过程,方便以后有需要时复用。 1、安装docker 下载最新版本的docker并且默认安装即可,安装后打开Docker Quickstart Terminal,初次进去需要一段时间。 下载网址:https://www.docker.com/products/dock 阅读全文
2016年3月10日
摘要:
朴素贝叶斯(Naive Bayes) http://www.cnblogs.com/sumai 1.模型 在GDA 中,我们要求特征向量 x 是连续实数向量。如果 x 是离散值的话,可以考虑采用朴素贝叶斯的分类方法。 以垃圾邮件分类为例子,采用最简单的特征描述方法,首先找一部英语词典,将里面的单词全 阅读全文
2016年3月9日
摘要:
高斯判别分析模型( Gaussian discriminant analysis)及Python实现 http://www.cnblogs.com/sumai 1.模型 高斯判别分析模型是一种生成模型,而之前所提到的逻辑回归是一种判别模型,生成模型和判别模型的详细了解可参考这篇文章: http:// 阅读全文
2016年3月3日
摘要:
广义线性模型(Generalized Linear Model) http://www.cnblogs.com/sumai 1.指数分布族 我们在建模的时候,关心的目标变量Y可能服从很多种分布。像线性回归,我们会假设目标变量Y服从正态分布,而逻辑回归,则假设服从伯努利分布。在广义线性模型的理论框架中 阅读全文
2016年2月28日
摘要:
逻辑回归模型(Logistic Regression)及Python实现 http://www.cnblogs.com/sumai 1.模型 在分类问题中,比如判断邮件是否为垃圾邮件,判断肿瘤是否为阳性,目标变量是离散的,只有两种取值,通常会编码为0和1。假设我们有一个特征X,画出散点图,结果如下所 阅读全文
2016年2月24日
摘要:
线性回归模型(Linear Regression)及Python实现 http://www.cnblogs.com/sumai 1.模型 对于一份数据,它有两个变量,分别是Petal.Width和Sepal.Length,画出它们的散点图。我们希望可以构建一个函数去预测Sepal.Length,当我 阅读全文