2020年6月9日
摘要: 1.手写数字数据集及预处理 # 1、手写数字数据集及预处理 from sklearn.datasets import load_digits digits = load_digits() # 读取手写数字数据集 X_data = digits.data.astype(np.float32) Y_da 阅读全文
posted @ 2020-06-09 11:08 carmen- 阅读(284) 评论(0) 推荐(0) 编辑
  2020年6月1日
摘要: 一、简述人工智能、机器学习和深度学习三者的联系与区别。 答:人工只能包括了机器学习和深度学习,而机器学习又包含了深度学习。人工智能是目的,是结果;深度学习、机器学习是方法,是工具;机器学习是一种实现人工智能的方法,机器学习直接来源于早期的人工智能领域。深度学习是一种实现机器学习的技术,深度学习使得机 阅读全文
posted @ 2020-06-01 17:03 carmen- 阅读(166) 评论(0) 推荐(0) 编辑
  2020年5月25日
摘要: 1.读取 # 1、读取数据集 def read_dataset(): file_path = r'SMSSpamCollection' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_reader = 阅读全文
posted @ 2020-05-25 10:35 carmen- 阅读(205) 评论(0) 推荐(0) 编辑
  2020年5月18日
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 # 1. 读邮件数据集文件,提取邮件本身与标签。 import numpy as np import csv file_path =r"SMSSpamCollection" sms= open(file_path,'r',encod 阅读全文
posted @ 2020-05-18 15:29 carmen- 阅读(313) 评论(0) 推荐(0) 编辑
  2020年5月10日
摘要: 一、理解分类与监督学习、聚类与无监督学习。 1、简述分类与聚类的联系与区别。 (1)联系:分类和聚类都包含一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点。 (2)区别:分类是可按已知规则进行。分类则属于有指导的学习,是示例式学习。 聚类要划分的类是未知的。聚类是一种无指导学习,它不依 阅读全文
posted @ 2020-05-10 16:38 carmen- 阅读(443) 评论(0) 推荐(0) 编辑
  2020年4月27日
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择: 从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA: 主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差 阅读全文
posted @ 2020-04-27 21:19 carmen- 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =0.0) from sklearn.feature_selection import VarianceThreshold # 阅读全文
posted @ 2020-04-27 20:57 carmen- 阅读(130) 评论(0) 推荐(0) 编辑
  2020年4月26日
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答:逻辑回归通过正则化可以防止过拟合。 因为过拟合的时候,拟合函数的系数往往非常大,过拟合,就是拟合函数需要顾忌每一个点,最终形成的拟合函数波动很大。在某些很小的区间里,函数值的变化很剧烈。这就意味着函数在某些小区 阅读全文
posted @ 2020-04-26 16:24 carmen- 阅读(190) 评论(0) 推荐(0) 编辑
  2020年4月24日
摘要: 一、用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 1、逻辑回归定义:是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。逻辑回归用于处理因变量为分类变量的回归问题,是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。 2、区别: (1)逻辑回 阅读全文
posted @ 2020-04-24 12:03 carmen- 阅读(193) 评论(0) 推荐(0) 编辑
  2020年4月20日
摘要: 一、本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1、什么是回归算法 回归算法是监督型算法的一种,通过利用测试集数据来建立模型,再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线,这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。 2、回归 阅读全文
posted @ 2020-04-20 22:38 carmen- 阅读(202) 评论(0) 推荐(0) 编辑