宋思康

2020年6月23日

大数据应用技术课程实践--选题与实践方案

摘要:  提交作业 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 我选择第一题hadoop平台应用,因为我们曾经学过大数据,做过类似的,对于这题比较有头绪,思路。 阅读全文

posted @ 2020-06-23 19:49 宋思康 阅读(175) 评论(0) 推荐(0) 编辑

2020年6月18日

补-特征选择

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文

posted @ 2020-06-18 08:53 宋思康 阅读(123) 评论(0) 推荐(0) 编辑

补-K均值算法

摘要: 4. 作业: 1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 上次做了。 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) import numpy as npfrom sklearn.datasets import load_irisimpor 阅读全文

posted @ 2020-06-18 08:45 宋思康 阅读(170) 评论(0) 推荐(0) 编辑

2020年6月7日

14 深度学习-卷积

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。 人工智能——机器诠释的人类智能 机器学习——实现人工智能的一种方式 深度学习——一种实现机器学习的技术 2. 全连接神 阅读全文

posted @ 2020-06-07 16:15 宋思康 阅读(130) 评论(0) 推荐(0) 编辑

2020年5月23日

垃圾邮件分类

摘要: 1.读取 2.数据预处理 import csv import nltk import re from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer import pandas as pd #返回类别 def 阅读全文

posted @ 2020-05-23 21:35 宋思康 阅读(260) 评论(0) 推荐(0) 编辑

垃圾邮件分类2

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文

posted @ 2020-05-23 19:27 宋思康 阅读(137) 评论(0) 推荐(0) 编辑

2020年5月13日

11.分类与监督学习,朴素贝叶斯分类算法

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 阅读全文

posted @ 2020-05-13 09:31 宋思康 阅读(150) 评论(0) 推荐(0) 编辑

2020年5月4日

9

摘要: 一 1:减少特征数量,降维,使模型泛化能力更强,减少过拟合,增强对特征和特征值之间的理解。 2:简化运算。 二 两者的主要区别:pca有限,pca是一种在数据集中最好的描述方差的一种方法,从而使原始数据在本质上是高维的。 阅读全文

posted @ 2020-05-04 19:52 宋思康 阅读(105) 评论(0) 推荐(0) 编辑

2020年4月29日

逻辑回归实践

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 1-逻辑回归是用正则化来防止过拟合的,而正则化就是控制模型空间的一种办法,所以正则化是通过控制模型空间来防止过拟合的。 2-没电脑 阅读全文

posted @ 2020-04-29 18:04 宋思康 阅读(142) 评论(0) 推荐(0) 编辑

2020年4月25日

逻辑回归

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 1-逻辑回归就是通过历史数据的表现,然后对未来结果发生的概率进行预测,重点是概率。而线性回归是通过数据来预测以后的数据,一个是概率,一个是数据。 2-过拟 阅读全文

posted @ 2020-04-25 21:09 宋思康 阅读(162) 评论(0) 推荐(0) 编辑

导航