2020年6月23日
摘要: 一、选题与意义 答:我选择选题二:Kaggle分析数据项目 -> 商店销量预测;因为选题一要下载很多东西,宿舍没有网线和wife,无法下载,而且要耗费太多时间安装软件。并且本学期对于进行数据清洗、数据处理、构建模型、进行应用等较为熟悉,能够检验一下自己的能力。 二、实践方案 理由:本学期已进行过数据 阅读全文
posted @ 2020-06-23 20:38 201706120066马鸿鑫 阅读(762) 评论(1) 推荐(0) 编辑
  2020年6月11日
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 结果: 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试 阅读全文
posted @ 2020-06-11 10:35 201706120066马鸿鑫 阅读(151) 评论(2) 推荐(0) 编辑
  2020年6月5日
摘要: 补交的作业(疫情在家学习期间无电脑,之前在家时已向老师说明情况了): 作业1:https://www.cnblogs.com/hongxinma/p/12895161.html 作业2:https://www.cnblogs.com/hongxinma/p/12895392.html 作业3:htt 阅读全文
posted @ 2020-06-05 21:50 201706120066马鸿鑫 阅读(682) 评论(0) 推荐(0) 编辑
  2020年5月21日
摘要: 补交的作业(疫情在家学习期间无电脑,之前在家时已向老师说明情况了): 作业1:https://www.cnblogs.com/hongxinma/p/12895161.html 作业2:https://www.cnblogs.com/hongxinma/p/12895392.html 作业3:htt 阅读全文
posted @ 2020-05-21 13:17 201706120066马鸿鑫 阅读(361) 评论(0) 推荐(0) 编辑
  2020年5月18日
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 答: 1.特征选择也称属性选择。是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关 阅读全文
posted @ 2020-05-18 09:55 201706120066马鸿鑫 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 答: 代码如下: from skle 阅读全文
posted @ 2020-05-18 09:53 201706120066马鸿鑫 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 答: 1.逻辑回归是通过正规化防止过拟合的。 在训练数据不够多时,常常会导致过拟合。正则化就是在代价函数后面再加上一个正则化项,过拟合的时候,拟合函数的系数往往 阅读全文
posted @ 2020-05-18 09:44 201706120066马鸿鑫 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 答: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是一种用于解决分类问题的机器学习方法,用于估计某事发生的可能性。比如某网友点击某网页的可能性,某病人患有某病的可能性等等。 不同:性质的不同,逻辑回归是一种广义的线性回归分析模型。而线性回归是利用数理统计中回归分析, 阅读全文
posted @ 2020-05-18 09:36 201706120066马鸿鑫 阅读(53) 评论(0) 推荐(0) 编辑
  2020年5月17日
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 答: 1. 本节重点知识点是线性回归算法,它属于监督学习的一种,是评估自变量X与因变量Y之 阅读全文
posted @ 2020-05-17 10:48 201706120066马鸿鑫 阅读(105) 评论(0) 推荐(0) 编辑
  2020年5月16日
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 2. 观察学习与生活中可以 阅读全文
posted @ 2020-05-16 16:11 201706120066马鸿鑫 阅读(82) 评论(0) 推荐(0) 编辑