摘要: 一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5、比较线性模型与非线性模型的性能,并说明原因。 如上图可知,非线性模型的性能比 阅读全文
posted @ 2018-12-17 15:34 Tlzlykc 阅读(148) 评论(0) 推荐(0) 编辑
摘要: data值 target值 feature_names值 DESCR值 w,b值 阅读全文
posted @ 2018-12-06 11:47 Tlzlykc 阅读(179) 评论(0) 推荐(0) 编辑
摘要: text = '"Go until jurong point, crazy.. Available only in bugis n great world la e buffet... Cine there got amore wat..."' import nltkfrom nltk.corpus 阅读全文
posted @ 2018-11-29 11:44 Tlzlykc 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮 阅读全文
posted @ 2018-11-22 09:48 Tlzlykc 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类是指在对数据集分类时,我们知道这个数据集是有多少种类的。 聚类是将数据对象的集合分成相似的对象类的过程,使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。即指在对数据集操作时,我们是不知道 阅读全文
posted @ 2018-11-17 23:04 Tlzlykc 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 观察原始图片与新图片所占用内存的大小。 将原始图片与新图片保存成文件,观察文件的大小。 from 阅读全文
posted @ 2018-11-04 23:00 Tlzlykc 阅读(248) 评论(0) 推荐(0) 编辑
摘要: import numpy as np x = np.random.randint(1,100,[20,1]) y = np.zeros(20) k = 3 #选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; def initcenter(x,k): #初始聚类中心数组 return x[0:k].reshape(k) #对于样本中的数据对象,根据它们与这些... 阅读全文
posted @ 2018-10-25 11:42 Tlzlykc 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。 阅读全文
posted @ 2018-10-20 18:22 Tlzlykc 阅读(124) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import matplotlib.pyplot as plt mu = 1 #期望为1 sigma = 3 #标准差为3 num = 10000 #个数为10000 rand_data = np.random.normal(mu, sigma, num) print(rand_data.shape,type(rand_data)) count,... 阅读全文
posted @ 2018-10-18 09:28 Tlzlykc 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 运行结果: 阅读全文
posted @ 2018-10-13 18:18 Tlzlykc 阅读(148) 评论(0) 推荐(0) 编辑