鲨鱼辣椒醋 - 博客园

2020年6月23日

摘要：一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目简要说明理由与意义选择题目一淘宝双11数据分析与预测，对于淘宝双11数据的分析与预测也可以更了解人们的购物行为。而且选择hadoop可以巩固知识。二、实践方案简要说明理由。步骤零：实验环境准备所需知识储备 Window 阅读全文

posted @ 2020-06-23 15:35 鲨鱼辣椒醋阅读(290) 评论(0) 推荐(0)

2020年6月11日

15 手写数字识别-小数据集

摘要：补交作业：第十二次作业--垃圾邮件分类：https://www.cnblogs.com/sgczw/p/13060726.html 第十三次作业--垃圾邮件分类2：https://www.cnblogs.com/sgczw/p/13060743.html （这两个作业电脑显卡炸了，返厂修了两周，所以阅读全文

posted @ 2020-06-11 08:47 鲨鱼辣椒醋阅读(221) 评论(0) 推荐(0)

2020年6月7日

13-垃圾邮件分类2

摘要： 1.读取 # 1、读取数据集 def read_dataset(): file_path = r'SMSSpamCollection' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_reader = 阅读全文

posted @ 2020-06-07 15:30 鲨鱼辣椒醋阅读(130) 评论(0) 推荐(0)

12.朴素贝叶斯-垃圾邮件分类

摘要： 1. 读邮件数据集文件，提取邮件本身与标签。列表 numpy数组 import csv sms = open('D:/education/SMSSpamCollection.txt', 'r', encoding='utf-8') data = csv.reader(sms, delimiter= 阅读全文

posted @ 2020-06-07 15:27 鲨鱼辣椒醋阅读(114) 评论(0) 推荐(0)

2020年6月4日

14 深度学习-卷积

摘要：补交作业：第十二次作业--垃圾邮件分类：https://www.cnblogs.com/sgczw/p/13060726.html 第十三次作业--垃圾邮件分类2：https://www.cnblogs.com/sgczw/p/13060743.html （这两个作业电脑显卡炸了，返厂修了两周，所以阅读全文

posted @ 2020-06-04 09:52 鲨鱼辣椒醋阅读(123) 评论(0) 推荐(0)

2020年5月13日

11.分类与监督学习，朴素贝叶斯分类算法

摘要： 1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。答：（1）分类和聚类：联系：分类和聚类都是把每一条记录归应到相应的类别里，都包含这一过程，对于想要分析的目标点，都会在数据集中寻找离它最近的点，二者都用到了NN算法。区别： 1）分类阅读全文

posted @ 2020-05-13 21:28 鲨鱼辣椒醋阅读(214) 评论(0) 推荐(0)

2020年5月3日

主成分分析

摘要：一、用自己的话描述出其本身的含义： 1、特征选择从原始特征中选取最有效的特征以降低数据集维度的过程。 2、PCA 利用降维的思想，把多指标转化为少数几个综合指标。二、并用自己的话阐述出两者的主要区别特征选择后还是原来的那个特征集，而PCA则特征集会变，特征数目会变少。阅读全文

posted @ 2020-05-03 14:40 鲨鱼辣椒醋阅读(116) 评论(0) 推荐(0)

2020年4月27日

8、特征选择

摘要：用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图放上来（没有条件的备注说明原因）注意：每个人的电脑ID是不一样的 from sklearn.featu 阅读全文

posted @ 2020-04-27 17:24 鲨鱼辣椒醋阅读(116) 评论(0) 推荐(0)

7.逻辑回归实践

摘要： 1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）逻辑回归通过正则化来防止过拟合；正则化可以防止过拟合是因为过拟合的时候，拟合函数的系数往往非常大，而正则化是通过约束参数的范数使其不要太大，所以可以在一定程度上减少过拟合情况，以L2正则化为例，正则项会使权重趋于阅读全文

posted @ 2020-04-27 17:06 鲨鱼辣椒醋阅读(147) 评论(0) 推荐(0)

2020年4月23日

6--逻辑回归

摘要： 1.用自己的话描述一下，什么是逻辑回归，与线性回归对比，有什么不同？答：逻辑回归就是通过历史数据的表现，然后对未来结果发生的概率进行预测，重点是概率。而线性回归是通过数据来预测以后的数据，一个是概率，一个是数据。 2.自述一下什么是过拟合和欠拟合？答：过拟合：太过贴近于训练数据的特征了，在训练阅读全文

posted @ 2020-04-23 11:40 鲨鱼辣椒醋阅读(152) 评论(0) 推荐(0)