摘要:
一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 线性模型与非线性模型性能的区 阅读全文
摘要:
1. 导入boston房价数据集。 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 阅读全文
摘要:
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
摘要:
1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: (1)多项式型 (2)高斯分布型 (3)伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类:找出描述并区分数据类或概念的模型,以便能够使用模型预测类标记未知的对象类。分类的目的是把数据项映射到给定的类别的某一个类中。 聚类:将本身没有类别的样本聚集成不同的组,把这组数据对象的集合叫簇。目的是使得属于同一个簇的样 阅读全文
摘要:
1、读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 观察原始图片与新图片所占用内存的大小。 #观察原始图片和新图片的内存大小 将原始图片与新图片保 阅读全文
摘要:
1.用python实现K均值算法 1)选取初始数据中的k个对象作为初始的中心,每个对象代表一个聚类中心: 2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最近的聚类中心(最相似)所对应的类; def nearest(kc, x[i]): j def x 阅读全文
摘要:
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的 阅读全文
摘要:
1、安装scipy,numpy,sklearn包; 2、从sklearn包自带的数据集读话的数据集; 3、查看数据类型 4、取出花的特性和类别数据,查看数据类型 5、取出所有花花萼的长度 6、取出所有花花瓣的长度和宽带 7、取出某朵花的四个特征和类别 8、将所有花分成三个组,每组50个 9、生成新的 阅读全文
摘要:
hh = '''You're on the phone with your girlfriend She's upset She's going off about something that you said 'Cause she doesn't get your humor like I do I'm in my room It's a typical Tuesday night I'm ... 阅读全文