摘要:
一、用自己的话描述出其本身的含义: 1、特征选择:从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。 2、PCA:即主成分分析技术,又称主分量分析。主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标 阅读全文
摘要:
这是我百度收集的常用的正则表达式拿去收藏吧,不用每次都要去百度啦! 一、校验数字的表达式 1. 数字:^[0-9]*$ 2. n位的数字:^\d{n}$ (\d与0-9意思一样) 3. 至少n位的数字:^\d{n,}$ 4. m-n位的数字:^\d{m,n}$ 5. 零和非零开头的数字:^(0|[1 阅读全文
摘要:
MongoDB的命令操作流程: 先进入MongoDB数据库 首先查看所有数据库: show dbs 1、创建demo数据库:use demo 查看当前数据库:db查看所有数据库:show dbs 因为demo还没有数据,所有无法显示出来 2、创建student集合:db.createCollecti 阅读全文
摘要:
MongoDB安装以及配置教程 安装的版本(mongo 3.4): mongodb-win32-x86_64-2008plus-ssl-3.4.4-signed.msi 资源: 链接:https://pan.baidu.com/s/1Rb71jp-YJGHKXqcWL2fUKQ 提取码:tvpd ★ 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 实现代码如下: from sklearn.feature_selection import VarianceThre 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? ①逻辑回归是怎么防止过拟合的? 1.增加样本量,适用任何模型。 2.如果数据稀疏,使用L1正则,其他情况,用L2正则要好点。 3.通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 4.如果还过拟合,那就看看是否使用了过度复杂的特征 阅读全文
摘要:
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? ①逻辑回归:是一种广义的线性回归分析模型。逻辑回归就是一个分类的算法,常见用在二分类当中,就是把我们的输入值在线性回归中转化为预测值,然后映射到Sigmoid 函数中,讲值作为x轴的变量,y轴作为一个概率,预测值对应的Y值越接近于 阅读全文
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 在本节课主要学习了线性回归算法,理解了算法的定义:线性回归是基于已有数据对未知的数据进行预测的。比如:①房价预测,如图1-1、数据可视化如图1-2; 图1-1 通过房面积来预测价格 图1-2 画出面积与房价的线性关系图 ② 阅读全文
摘要:
1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 实现代码部分: from 阅读全文
摘要:
1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 ①随机在扑克牌中抽取30张牌,当中取3张聚类中心10,4,2 进行分类 ②计算三堆牌的平均值分别为11,5,2。 ③以11,5,2为新的聚类中心来分类 ④计算平均值,均值不变,分类结束。 2). *自主编写K-means算法 ,以鸢尾花花瓣长度 阅读全文