04 2020 档案

摘要:一、用自己的话描述出其本身的含义: 1、特征选择 ①特征选择就是特征降维中进行人工选择的方式,主观性剔除不要的特征。 2、PCA ②主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。 二、并用自己的话阐述出两者的主要区别 特征选择是从 阅读全文
posted @ 2020-04-28 22:22 SeBr7 阅读(187) 评论(0) 推荐(0)
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1) ①. 增加样本量,这是万能的方法 ②通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 (2)过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少 阅读全文
posted @ 2020-04-28 20:10 SeBr7 阅读(162) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) from sklearn.feature_selection import VarianceThreshold de 阅读全文
posted @ 2020-04-27 12:42 SeBr7 阅读(152) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 首先逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。 ①性质不同 逻辑回归:是一种广义的线性回归分析模型。 线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 阅读全文
posted @ 2020-04-24 17:54 SeBr7 阅读(128) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 ①回归算法分类 ②回归算法 ③监督学习的区别 ④线性回归的应用 ⑤定义 矩阵运算 import matplotlib.pyplot as plt import numpy as np import random # plt 阅读全文
posted @ 2020-04-21 19:28 SeBr7 阅读(233) 评论(0) 推荐(0)
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 import sys import numpy as np from sklearn.datasets import load_sample_image from sklearn.cluste 阅读全文
posted @ 2020-04-19 15:31 SeBr7 阅读(153) 评论(0) 推荐(0)
摘要:作业: 1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 ①随机在扑克牌中抽取30张牌,当中取3张聚类中心10,5,2 进行分 ②计算三堆牌的平均值分别为10.5,5.5,2。 ③以11,6,2为新的聚类中心来分类 ④计算平均值,均值不变,分类结束。 2). *自主编写K-means算法 ,以 阅读全文
posted @ 2020-04-15 22:57 SeBr7 阅读(284) 评论(0) 推荐(0)
摘要:本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶 阅读全文
posted @ 2020-04-15 21:46 SeBr7 阅读(194) 评论(0) 推荐(0)
摘要:1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。 2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 3)什么是机器学习,有哪些分类?结合案例,写出你的理解。 监督学习 监督学习(Supervised Learning)表示机器学习的 阅读全文
posted @ 2020-04-03 20:08 SeBr7 阅读(158) 评论(0) 推荐(0)