2020年6月10日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() digits = load_digits() x_data = digits.data.astype(np.float32) y_data = digi 阅读全文
posted @ 2020-06-10 17:07 黑夜的时候h 阅读(136) 评论(0) 推荐(0) 编辑

2020年6月3日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。 搞清三者关系的最简单方法,就是把它们想象成一个同心圆,其中人工智能最大,此概念也最先问世;然后是机器学习,出现的稍晚; 阅读全文
posted @ 2020-06-03 19:10 黑夜的时候h 阅读(168) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 16:27 黑夜的时候h 阅读(107) 评论(0) 推荐(0) 编辑

2020年5月19日

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-19 22:42 黑夜的时候h 阅读(150) 评论(0) 推荐(0) 编辑

2020年5月9日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答: (1)分类与聚类: 分类简单来说,就是根据文本的特征或属性,划分到已有的类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行 阅读全文
posted @ 2020-05-09 22:43 黑夜的时候h 阅读(211) 评论(0) 推荐(0) 编辑

2020年4月27日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 答:就是当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练的这样一个过程。 2、PCA 答:在空间上,PCA可以理解为把原始数据投射到一个新的坐标系统,第一主成分为第一坐标轴,它的含义代表了原始数据中多个变量经过某种变换得到 阅读全文
posted @ 2020-04-27 20:23 黑夜的时候h 阅读(159) 评论(0) 推荐(0) 编辑
 
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) A 逻辑回归是怎么防止过拟合 1. 增加样本量,这是万能的方法,适用任何模型。 2. 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。 3. 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 阅读全文
posted @ 2020-04-27 20:05 黑夜的时候h 阅读(115) 评论(0) 推荐(0) 编辑
 
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: 运行结果: 阅读全文
posted @ 2020-04-27 15:36 黑夜的时候h 阅读(151) 评论(0) 推荐(0) 编辑

2020年4月25日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。 一、性质不同 1、逻辑回归:是一种复广义的线性回归分析模型。 2、线性回归:利用数理统计中 阅读全文
posted @ 2020-04-25 17:04 黑夜的时候h 阅读(173) 评论(0) 推荐(0) 编辑

2020年4月22日

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 A 机器学习回归的分类 B 分类与回归的区别 C 线性回归的应用 a 贷款额度预测 b 面积与房价的关系 c 房价预测 D 线性回归的模型 E 线性回归算法的优化 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 阅读全文
posted @ 2020-04-22 16:02 黑夜的时候h 阅读(165) 评论(0) 推荐(0) 编辑