摘要:
1.导入模块 //用于发送请求 const https =require('https'); const http =require('http'); //用于提取网页中的img标签 const cheerio =require('cheerio') //用于将http响应文件写入到文件中 cons 阅读全文
摘要:
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x: 阅读全文
摘要:
1.简述人工智能、机器学习和深度学习三者的联系与区别。 一、概念的区别 1、人工智能 人工智能(Artificial intelligence)简称AI。人工智能是计算机科学的一个分支,它企图了解智能的本质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,是研究、开发用于模拟、延伸和扩展人 阅读全文
摘要:
13-垃圾邮件分类2 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(dat 阅读全文
摘要:
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组代码: import csv file_path =r"SMSSpamCollection" sms= open(file_path,'r',encoding='utf-8') data=csv.reader(sms,delimite 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 简述分类与聚类的联系与区别: 聚类分析是研究如何在没有训练的条件下把样本划分为若干类。 在分类中,已知存在哪些类,即对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记 阅读全文
摘要:
一、用自己的话描述出其本身的含义: 1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)增加样本量,这是万能的方法,适用任何模型 (2)通过特征选择,剔除一些不重要的特征,从而降低模型复杂度 (3) 逻辑回归特有的防止过拟合方法:进行离散化处理,所有特征都离散化 (4)算法层面-正则化。 2.用 阅读全文
摘要:
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是一种广义的线性回归分析模型,它的输入可以连续型输入,输出为离场型输出; 区别: 线性回归要求因变量必须是连续性数据变量;逻辑回归要求因变量必须是分类变量,二分类或者多分类的; 2.自述一下什么是过拟合和欠拟合? 过拟合: 阅读全文