摘要: 大作业一 boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 #1.导入boston房价数据集 from sklearn.datasets import load_boston ... 阅读全文
posted @ 2018-12-24 18:45 傻猪一号 阅读(328) 评论(0) 推荐(0) 编辑
摘要: #1.导入boston房价数据集 from sklearn.datasets import load_boston boston = load_boston() boston.keys() print(boston.DESCR) boston.data.shape boston.feature_names import pandas as pd pd.DataFrame(boston.dat... 阅读全文
posted @ 2018-12-09 20:27 傻猪一号 阅读(203) 评论(0) 推荐(0) 编辑
摘要: text = '''The world is changing and time is spinning fast it's so amazing how you came into my life I know it seems all hope is gone I know you feel you can't be strong and once again the story ends ... 阅读全文
posted @ 2018-12-05 23:10 傻猪一号 阅读(121) 评论(0) 推荐(0) 编辑
摘要: #1.使用朴素贝叶斯模型对iris数据集进行花分类 #尝试使用3种不同类型的朴素贝叶斯: #高斯分布型,多项式型,伯努利型 #GaussianNB from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() #建立... 阅读全文
posted @ 2018-11-25 16:14 傻猪一号 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 有监督学习: 不仅把训练数据丢给计算机,而且还把分类的结果(数据具有的标签)也一并丢给计算机分析。 由于计算机在学习的过程中不仅有训练数据,而且有训练结果(标签),因此训练的效果通常不错。训练结束之后进行测试 计算机进行学习之后,再丢给它新的未知的数据,它 阅读全文
posted @ 2018-11-18 21:20 傻猪一号 阅读(412) 评论(0) 推荐(0) 编辑
摘要: ##导包 from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import matplotlib.image as img import sys ##读取一张示例图片或自己准备的图片... 阅读全文
posted @ 2018-11-04 20:15 傻猪一号 阅读(216) 评论(0) 推荐(0) 编辑
摘要: import numpy as np ##从1到100随机生成一个20行1列的数组 x = np.random.randint(1,100,[20,1]) print(x.shape) print(x) ##返回来一个给定形状和类型的用0填充的数组; y = np.zeros(20) print(y) ##给定聚类中心的值 k = 3 #numpy.where(condition[, x, y]... 阅读全文
posted @ 2018-10-30 11:47 傻猪一号 阅读(256) 评论(0) 推荐(0) 编辑
摘要: #导包 import numpy as np from sklearn.datasets import load_iris import matplotlib.pylot as plt data = load_iris() iris = data.data #计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。 x = np.max(iris) print(x) #最大值 x =... 阅读全文
posted @ 2018-10-18 11:40 傻猪一号 阅读(222) 评论(0) 推荐(0) 编辑
摘要: #. 安装scipy,numpy,sklearn包 #2. 从sklearn包自带的数据集中读出鸢尾花数据集data from sklearn.datasets import load_iris import numpy as np data=load_iris() #3.查看data类型,包含哪些数据 print(type(data)) print(data.keys()) #取出鸢尾花特征和... 阅读全文
posted @ 2018-10-15 11:47 傻猪一号 阅读(193) 评论(0) 推荐(0) 编辑
摘要: # 1.用列表+循环实现,并包装成函数 def pySum(n): a = list(range(n)) b = list(range(0,5*n,5)) c = [] for i in range(len(a)): c.append(a[i]**2 + b[i]**3) return(c) print(pySum(10)) # 2.用nu... 阅读全文
posted @ 2018-09-29 12:50 傻猪一号 阅读(76) 评论(0) 推荐(0) 编辑