2020年6月23日

摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 答: 题目:Kaggle分析数据项目 泰坦尼克号生还预测 二、实践方案 简要说明理由。 三、实践任务分解 根据所选的题目,明确实验步骤,分解任务到每天。 四、实践计划 按任务分解撰写计划表,每天按计划表开展 阅读全文
posted @ 2020-06-23 19:52 、秋天 阅读(220) 评论(0) 推荐(0) 编辑

2020年6月14日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 答: 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集 阅读全文
posted @ 2020-06-14 20:41 、秋天 阅读(202) 评论(0) 推荐(0) 编辑

2020年6月6日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答: 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。 搞清三者关系的最简单方法,就是把它们想象成一个同心圆,其中人工智能最大,此概念也最先问世;然后是机器学习,出现的 阅读全文
posted @ 2020-06-06 22:30 、秋天 阅读(305) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 20:33 、秋天 阅读(158) 评论(0) 推荐(0) 编辑

2020年5月17日

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-05-17 20:08 、秋天 阅读(165) 评论(0) 推荐(0) 编辑

2020年5月13日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答: 分类简单来说,就是根据文本的特征或属性,划分到已有的类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。而聚类的理解更 阅读全文
posted @ 2020-05-13 15:29 、秋天 阅读(190) 评论(0) 推荐(0) 编辑

2020年4月30日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA:将多个变量通过线性变换以选出较少个重要变量的一种多元统计分析方法。本质上是从一个维度空间映射到另一个维度空间, 阅读全文
posted @ 2020-04-30 20:08 、秋天 阅读(130) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 答: # 用过滤法进行特征选择 fr 阅读全文
posted @ 2020-04-29 22:40 、秋天 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)逻辑回归是怎么防止过拟合的? 1. 可以增加样本量,这是万能的方法,适用任何模型。2. 如果数据比较稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。3. 通过特征选择,剔除一些不重要的特征,从而降低模型 阅读全文
posted @ 2020-04-29 16:43 、秋天 阅读(187) 评论(0) 推荐(0) 编辑

2020年4月26日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 一、性质不同1、逻辑回归:是一种广义的线性回归分析模型。2、线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。二、应用不同1、逻辑回归:常用于数据挖掘,疾病自动诊断,经济预测等领域。 阅读全文
posted @ 2020-04-26 09:10 、秋天 阅读(271) 评论(0) 推荐(0) 编辑

导航