摘要: 1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编 阅读全文
posted @ 2020-04-01 15:49 HoioH 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 1、聚类-Kmeans算法应用 观察学习与生活中可以用K均值解决的问题,从数据-模型训练-测试-预测完整地完成一个应用案例。 这是从网上摘录的数据--地址:https://www.scoregg.com/data/player?tournamentID=169 数据背景:2020英雄联盟季中杯挑战赛 阅读全文
posted @ 2020-06-10 14:04 HoioH 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x: 阅读全文
posted @ 2020-06-10 01:13 HoioH 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 ①人工智能 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以 人类智能相似的方式做出反应的智能机器,该领域的研究包括语音识别、图像识别、 机器人、自然语言处理、智能搜索和专家系统等。人工智能可以对人的意识、思维的 信息 阅读全文
posted @ 2020-06-03 12:45 HoioH 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 1.读取 #1.读取数据集 def read_dataset(): file_path = r'D:\SMSSpamCollection.txt' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_rea 阅读全文
posted @ 2020-05-27 12:59 HoioH 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path =r"SMSSpamCollection" sms= open(file_path,'r',encoding='utf-8') data=csv.reader(sms,delimiter = 阅读全文
posted @ 2020-05-19 16:40 HoioH 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。 联系:分类与聚类都是在数据集中寻找离自己最近的点 区别:分类是一种有监督学习,目的是为了确定点的类别,而类别是已知的;聚类是一种无监督学习,目的是将点分为成若干个类,事先是没有类别的。 监督学习: 阅读全文
posted @ 2020-05-12 16:16 HoioH 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献 阅读全文
posted @ 2020-05-01 15:01 HoioH 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3],[0,1,4,3],[0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.feature 阅读全文
posted @ 2020-05-01 15:01 HoioH 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1)减少数量特征或正则化 2)正则化不需减少数量特征,只需要通过减小特征变量的数量级使他们接近于0.这样子就可以形成一个类似二元的多元函数。 2.用logiftic回归来进行实践操作,数据不限。 import pa 阅读全文
posted @ 2020-04-28 17:29 HoioH 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归:一种有监督的统计学习方法,主要用于对样本进行分类。 线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 对比:逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相 阅读全文
posted @ 2020-04-23 13:32 HoioH 阅读(157) 评论(0) 推荐(0) 编辑