摘要:
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() digits = load_digits() X_data = digits.data.astype(np.float32) Y_data = digi 阅读全文
摘要:
1.简述人工智能、机器学习和深度学习三者的联系与区别。 (1)人工智能:目的和结果,深度学习,机器学习是方法,是工具。 (2) 机器学习:一种实现人工智能的方法;机器学习都可以被精准地定义为:1、任务2、训练过程3、模型表现 (3)深度学习:是一种实现机器学习的技术,适合处理大数据 2. 全连接神经 阅读全文
摘要:
1.读取 # 1.读取数据集 def read_dataset(): file_path = r'D:\SMSSpamCollection.txt' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_re 阅读全文
摘要:
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 # 读邮件数据集文件,提取邮件本身与标签 import numpy as np import csv file_path =r"D:\SMSSpamCollection.txt" sms= open(file_path,'r',en 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 阅读全文
摘要:
一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 解: 一、 1、特征选择:从全部特征中选取一个特征子集,使得使构造出来的模型效果更好,推广能力更强,是能剔除不相关、冗余、没有差异刻画能力的特征,从而达到减少特征个数、减少训练或者运行时间、提高模型精 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 解: 1、 (1)增加样本量,这是万能的方法,适用任何模型;如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试;通过特征选择,剔除一些不重要的特征,从 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 解: 代码编写: 结果: 阅读全文
摘要:
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 解: 1. 逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 线性回归是利用数理统计中回 阅读全文
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 解: 1. 回归算法的背景: 监督学习:回归和分类的区别 重点:最小二乘法之梯度下降法 重 阅读全文