会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
时光~轨迹
昵称:
时光~
园龄:
6年1个月
粉丝:
0
关注:
3
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔档案
2020年6月(3)
2020年5月(4)
2020年4月(8)
2019年12月(3)
2019年11月(4)
2019年10月(4)
2019年9月(4)
相册
第八次作业(8)
第二次作业(3)
第七次作业(5)
第三次作业(2)
第四次作业(2)
第五次作业(2)
阅读排行榜
1. 机器学习——13-垃圾邮件分类2(585)
2. 机器学习——11.分类与监督学习,朴素贝叶斯分类算法(518)
3. 第一次作业—编译原理概述(451)
4. 第四次作业---文法和语言总结与梳理(317)
5. 第五次作业 简易词法分析器(296)
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2020年6月23日
大数据应用技术课程实践--选题与实践方案
摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 我选择Hadoop平台应用的淘宝双11数据分析与预测,选这个题目是因为起既可以学习到Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和
阅读全文
posted @ 2020-06-23 17:37 时光~
阅读(282)
评论(0)
推荐(0)
编辑
2020年6月13日
机器学习——15 手写数字识别-小数据集
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digitsimport numpy as npdigits=load_digits
阅读全文
posted @ 2020-06-13 19:41 时光~
阅读(283)
评论(0)
推荐(0)
编辑
2020年6月7日
机器学习——14 深度学习-卷积
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的
阅读全文
posted @ 2020-06-07 00:59 时光~
阅读(265)
评论(0)
推荐(0)
编辑
2020年5月23日
机器学习——13-垃圾邮件分类2
摘要: 1.读取 file_path=r'C:\Users\AAAA\PycharmProjects\untitled\data\SMSSpamCollection' #读取文件 sms=open(file_path,'r',encoding='utf-8') #打开文件 sms_data=[] sms_l
阅读全文
posted @ 2020-05-23 16:40 时光~
阅读(585)
评论(0)
推荐(0)
编辑
2020年5月14日
机器学习——12.朴素贝叶斯-垃圾邮件分类
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 图1 来自老师讲解 2.2 nltk库的安装与使用 pip install nltk impo
阅读全文
posted @ 2020-05-14 18:00 时光~
阅读(219)
评论(0)
推荐(0)
编辑
2020年5月12日
机器学习——11.分类与监督学习,朴素贝叶斯分类算法
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:都是对数据进行划分的方法 区别:分类就是“贴标签”,在事先已有的类中按这些类的性质来进行划分,要做的就是将每一条记录分别属于哪一类标记出来,常用算法KNN,是一种有监督学习; 聚类是在事先没有类,没有训练条件的情况下,根
阅读全文
posted @ 2020-05-12 19:30 时光~
阅读(518)
评论(0)
推荐(0)
编辑
2020年5月2日
机器学习——09、主成分分析
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是在一大堆数据中删除相关性系数比较低对结果没什么影响的特征,从而降维优化计算程度。 减少特征具有重要的现实意义,不仅减少过拟合、减少特征数量(降维)、提高模型泛化能力,而且还可以使模型获得更好的解释性,增强对特征和特征值之间的理解,加快模型
阅读全文
posted @ 2020-05-02 11:11 时光~
阅读(188)
评论(0)
推荐(0)
编辑
2020年4月29日
机器学习——08、特征选择
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 特征选择的原因: ①冗余:部分特征的
阅读全文
posted @ 2020-04-29 10:06 时光~
阅读(140)
评论(0)
推荐(0)
编辑
2020年4月27日
机器学习——07.逻辑回归实践
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归是通过正则化防止过拟合的。数据正规化是将数据的每个样本(向量)变换为单位范数的向量,各样本之间是相互独立的。其实际上,是对向量中的每个分量值除以正规化因子。过拟合是因为数据太多太杂而造成测试误差高,而正规化
阅读全文
posted @ 2020-04-27 10:10 时光~
阅读(202)
评论(0)
推荐(0)
编辑
2020年4月25日
机器学习——06.逻辑回归
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 简单来说, 逻辑回归是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。逻辑回归与线性回归都是一种广义线性模型。逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布。可以说,逻辑回归是以线性
阅读全文
posted @ 2020-04-25 12:59 时光~
阅读(168)
评论(0)
推荐(0)
编辑
下一页
点击右上角即可分享