摘要: 一、boston房价预测 1.导入包 2.导入数据集 3 .训练集与测试集划分 4.线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 (1)建立模型 (2)检测模型好坏 5.多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 (1)多项式化 (2)建立模型 (3) 阅读全文
posted @ 2018-12-17 11:40 崔泽贤 阅读(411) 评论(0) 推荐(0) 编辑
摘要: 1. 导入boston房价数据集 from sklearn.datasets import load_boston import pandas as pd boston = load_boston() df = pd.DataFrame(boston.data) 2. 一元线性回归模型,建立一个变量 阅读全文
posted @ 2018-12-10 08:49 崔泽贤 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 简述分类与聚类的联系与区别。 分类是指在对数据集分类时,我们知道这个数据集是有多少种类的。 聚类是将数据对象的集合分成相似的对象类的过程,使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。即指在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的,是将数据集中 阅读全文
posted @ 2018-11-26 09:03 崔泽贤 阅读(1650) 评论(0) 推荐(0) 编辑
摘要: 1.读取一张示例图片或自己准备的图片,观察图片存放数据特点。 2.根据图片的分辨率,可适当降低分辨率。 3.再用k均值聚类算法,将图片中所有的颜色值做聚类。 阅读全文
posted @ 2018-11-12 11:39 崔泽贤 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1.选取初始数据中的k个对象作为初始的中心 2. 按照数据与这些聚类中心的欧氏距离,分配到最近的聚类中心 3.更新聚类中心 4.判断聚类中心和目标函数的值是否发生改变 5.鸢尾花花瓣长度做聚类分析并用散点图显示出来 6. 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类并用散 阅读全文
posted @ 2018-11-12 11:15 崔泽贤 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 1.安装scipy,numpy,sklearn包 2. 从sklearn包自带的数据集中读出鸢尾花数据集data 3.查看data类型,包含哪些数据 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 5.取出所有花的花萼长度(cm)的数据 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的 阅读全文
posted @ 2018-10-29 11:14 崔泽贤 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 一、处理日期时间 1.取系统时间 2.转换成‘2017年9月30日星期六10时28分56秒’格式字符串 3.’2018-10-25 22:00‘转换成一个日期时间变量 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12+b 阅读全文
posted @ 2018-10-22 10:49 崔泽贤 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 1.英文 2.中文小说 阅读全文
posted @ 2018-10-15 11:40 崔泽贤 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 总结列表,元组,字典,集合的联系与区别。 1. 列表(list) 具有以下特点: 1.可以用list()函数或者方括号[]创建,元素之间用逗号’,‘’分隔。 2.列表的元素不需要具有相同的类型 3.使用索引来访问元素 4.可切片 元组 元组跟列表很像,只不过元组用小括号来实现(),这里要区分好和生成 阅读全文
posted @ 2018-10-08 11:33 崔泽贤 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 1.完整的温度转换程序 结果为: 2.猜数字游戏 结果为: 3.解析身份证号、学号不同片段的含义 结果为: 4.字符串的:连接,重复,in判断 结果为: 阅读全文
posted @ 2018-09-10 11:40 崔泽贤 阅读(146) 评论(0) 推荐(0) 编辑