罗奕涛

2020年12月2日

摘要：友情提示：安装目录不要有中文 1. nacos 介绍 https://nacos.io/zh-cn/docs/quick-start.html 2.安装jdk http://www.mamicode.com/info-detail-2893658.html 百度网盘：链接: https://pan. 阅读全文

posted @ 2020-12-02 17:53 罗奕涛阅读(80) 评论(0) 推荐(0)

2020年6月23日

大数据应用技术课程实践--选题与实践方案

摘要：一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目简要说明理由与意义。选择 1.Hadoop平台应用 --网站用户购物行为分析理由：想巩固下之前学的知识二、实践方案简要说明理由。步骤零：实验环境准备查看实验指南步骤一：本地数据集上传到数据仓库Hive 查看实验指南阅读全文

posted @ 2020-06-23 19:27 罗奕涛阅读(272) 评论(0) 推荐(0)

2020年6月12日

15 手写数字识别-小数据集

摘要： 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 源代码： 1 from sklearn.datasets import load_digits 2 from sklearn.preprocessing 阅读全文

posted @ 2020-06-12 08:57 罗奕涛阅读(269) 评论(0) 推荐(0)

2020年6月5日

14 深度学习-卷积

摘要： 1.简述人工智能、机器学习和深度学习三者的联系与区别。机器学习是一种实现人工智能的方法，深度学习是一种实现机器学习的技术。 2. 全连接神经网络与卷积神经网络的联系与区别。卷积神经网络也是通过一层一层的节点组织起来的。和全连接神经网络一样，卷积神经网络中的每一个节点就是一个神经元。在全连接神经网阅读全文

posted @ 2020-06-05 01:00 罗奕涛阅读(170) 评论(0) 推荐(0)

2020年5月21日

13-垃圾邮件分类2

摘要： 1.读取源代码： #读取文件 file_path=r'D:\PycharmProjects\201706120186罗奕涛\data\SMSSpamCollection' sms=open(file_path,'r',encoding='utf-8') sms_data=[] sms_label= 阅读全文

posted @ 2020-05-21 11:26 罗奕涛阅读(297) 评论(0) 推荐(1)

2020年5月14日

12.朴素贝叶斯-垃圾邮件分类

摘要： 1. 读邮件数据集文件，提取邮件本身与标签。列表 numpy数组 2.邮件预处理邮件分句句子分词大小写，标点符号，去掉过短的单词词性还原：复数、时态、比较级连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文

posted @ 2020-05-14 12:05 罗奕涛阅读(205) 评论(0) 推荐(0)

2020年5月7日

11.分类与监督学习，朴素贝叶斯分类算法

摘要：老师：MissDu 提交作业 1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。分类：在已知的类中自己找相似性，自动归类。（先前已有类）聚类：在大量的数据中把相似的聚成一类。（先前未有类）监督学习：从大量的先前知识中来判断是什么类型。（阅读全文

posted @ 2020-05-07 11:43 罗奕涛阅读(240) 评论(0) 推荐(0)

2020年4月30日

9、主成分分析

摘要：一、用自己的话描述出其本身的含义： 1、特征选择：相当于人为的控制一些特征里面的分布数据和大小分布，这种主成分降维就是通过数学运算，得到一个好的结果。 2、PCA：是一种分析、简化数据集的技术。可以尽可能降低原数据的维度（复杂度），损失少量信息。二、并用自己的话阐述出两者的主要区别特征选择：只阅读全文

posted @ 2020-04-30 10:06 罗奕涛阅读(237) 评论(0) 推荐(0)

2020年4月27日

8、特征选择

摘要：用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图放上来（没有条件的备注说明原因）注意：每个人的电脑ID是不一样的代码： from sklearn.f 阅读全文

posted @ 2020-04-27 16:46 罗奕涛阅读(128) 评论(0) 推荐(1)

2020年4月26日

7.逻辑回归实践

摘要： 1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）通过正则化来防止过拟合。通过正则化把许多隐藏的单元权重的影响消除掉，这样这个神经网络就会变成一个小网络，没有那么复杂，这样就可以防止过拟合了。 2.用logiftic回归来进行实践操作，数据不限。 import 阅读全文

posted @ 2020-04-26 17:27 罗奕涛阅读(203) 评论(0) 推荐(0)

公告