Queena-R

2018年12月24日

摘要：一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型：建立13个变量与房价之间的预测模型，并检测模型好坏。 4. 多项式回归模型：建立13个变量与房价之间的预测模型，并检测模型好坏。 5. 比较线性模型与非线性模型的性能，并说明原因。线性回归模型，是利用数理统计阅读全文

posted @ 2018-12-24 00:17 Queena-R 阅读(433) 评论(0) 推荐(0)

2018年12月13日

回归模型与房价预测

摘要： 1. 导入boston房价数据集 2. 一元线性回归模型，建立一个变量与房价之间的预测模型，并图形化显示。 3. 多元线性回归模型，建立13个变量与房价之间的预测模型，并检测模型好坏，并图形化显示检查结果。 4. 一元多项式回归模型，建立一个变量与房价之间的预测模型，并图形化显示。阅读全文

posted @ 2018-12-13 09:03 Queena-R 阅读(392) 评论(0) 推荐(0)

2018年12月6日

朴素贝叶斯应用：垃圾邮件分类

摘要： #导包 import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer import csv import numpy as np from sklearn.model_selection import train_test_split from sklearn.feature... 阅读全文

posted @ 2018-12-06 08:29 Queena-R 阅读(163) 评论(0) 推荐(0)

2018年11月22日

1122作业

摘要： 1.使用朴素贝叶斯模型对iris数据集进行花分类尝试使用3种不同类型的朴素贝叶斯：高斯分布型多项式型伯努利型 2.使用sklearn.model_selection.cross_val_score()，对模型进行验证高斯分布型多项式型伯努利型 3. 垃圾邮件分类数据准备：用csv读阅读全文

posted @ 2018-11-22 11:33 Queena-R 阅读(157) 评论(0) 推荐(0)

2018年11月18日

1115作业

摘要：一、理解分类与监督学习、聚类与无监督学习。 1、简述分类与聚类的联系与区别。分类就是按照某种标准给对象贴标签(label)，再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是，分类是事先定义好类别，类别数不变。分类器需要由人工标注的分类训练阅读全文

posted @ 2018-11-18 21:31 Queena-R 阅读(162) 评论(0) 推荐(0)

2018年11月1日

1101 作业

摘要：一、读取一张示例图片或自己准备的图片，观察图片存放数据特点。二、根据图片的分辨率，可适当降低分辨率。三、再用k均值聚类算法，将图片中所有的颜色值做聚类，然后用聚类中心的颜色代替原来的颜色值。四、形成新的图片。五、观察原始图片与新图片所占用内存的大小。将原始图片与新图片保存成文件，观察文件的大阅读全文

posted @ 2018-11-01 11:38 Queena-R 阅读(112) 评论(0) 推荐(0)

2018年10月31日

第八次作业

摘要： 1.用python实现K均值算法 K-means是一个反复迭代的过程，算法分为四个步骤：（x,k,y) 1）选取数据空间中的K个对象作为初始中心，每个对象代表一个聚类中心； def initcenter(x, k): kc 2）对于样本中的数据对象，根据它们与这些聚类中心的欧氏距离，按距离最近阅读全文

posted @ 2018-10-31 21:45 Queena-R 阅读(167) 评论(0) 推荐(0)

2018年10月20日

10.18第五次作业

摘要：一、计算鸢尾花花瓣长度的最大值，平均值，中值，均方差。二、用np.random.normal()产生一个正态分布的随机数组，并显示出来。三、np.random.randn()产生一个正态分布的随机数组，并显示出来。四、显示鸢尾花花瓣长度的正态分布图，曲线图，散点图。阅读全文

posted @ 2018-10-20 22:05 Queena-R 阅读(154) 评论(0) 推荐(0)

2018年10月14日

1011第四次作业

摘要：一. 安装scipy，numpy，sklearn包二. 从sklearn包自带的数据集中读出鸢尾花数据集data 三.查看data类型，包含哪些数据四.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型五.取出所有花的花萼长度(cm)的数据六.取出所有花的花瓣长度(cm)+花瓣宽度(cm) 阅读全文

posted @ 2018-10-14 21:45 Queena-R 阅读(164) 评论(0) 推荐(0)

2018年9月29日

0929第五次练习

摘要：一、用列表+循环实现，并包装成函数结果如下：二、用numpy实现，并包装成函数三、对比两种方法实现的效率，给定一个较大的参数n，用运行函数前后的timedelta表示。给定n=30，可以看出，以array为对象的numpy计算方式最快，而以numpy直接计算最慢，内置函数速度排第二。阅读全文

posted @ 2018-09-29 11:59 Queena-R 阅读(113) 评论(0) 推荐(0)

公告