上一页 1 2 3 4 5 6 7 ··· 29 下一页
摘要: 时间序列是一种衡量事物随时间变化的数据类型。在一个时间序列数据集中,时间列本身不代表一个变量:它实际上是一个基本结构,可以使用它对数据集排序。由于我们需要应用特定的数据预处理和特征工程技术来处理时间序列数据,因此这种基本的时间结构使时间序列问题更具有挑战性。 时间序列预测就是利用过去一段时间的数据来 阅读全文
posted @ 2022-06-20 14:26 王陸 阅读(936) 评论(0) 推荐(0) 编辑
摘要: 特征抽取与特征选择在功能上类似,都最终实现了数据集特征数量的减少,但特征选择得到的是原有特征的子集,而特征抽取是将原有特征根据某种函数关系转换为新的特征,并且数据集维度比原来的低。两者所得到的的特征集合与原特征集合对应关系不同。 4.1 无监督特征抽取 实现无监督特征抽取的算法有很多,这里仅以“主成 阅读全文
posted @ 2022-06-09 21:28 王陸 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 经过“数据清理”和“特征变换”后的数据集,已经满足了数据科学项目中算法对数值的基本要求。但是, 不呢止步于此,数据集的特征数量、质量会影响计算效率和最终模型的预测、分类效果。所以要对特征进行选择,即根据具体的项目选择适合的特征。 3.1 特征选择简述 是不是维度越大的数据越好?是不是所有的维度都是必 阅读全文
posted @ 2022-06-09 20:20 王陸 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 数据科学项目中少不了要用到机器学习算法。通常每种算法都会对数据有相应的要求,比如有的算法要求数据集特征是离散的,有的算法要求数据集特征是分类型的,而数据集特征不一定就满足这些要求,必须依据某些原则、方法对数据进行变换。 2.1 特征的类型 特征的类型由其所有值的集合决定,通常有如下几种: 分类型:性 阅读全文
posted @ 2022-06-09 16:20 王陸 阅读(643) 评论(0) 推荐(0) 编辑
摘要: 现实的数据是多种多样的,即使它们已经是结构化的,仍可能存在各种问题,如数据不完整、丢失、类型错误、前后不一致等。因此需要进行数据清理(Data cleaning),也译为数据清洗。 1.1 基本概念 通常以二维表的方式表示数据,Pandas的DataFrame类型的数据是最常见的。 import p 阅读全文
posted @ 2022-06-09 14:02 王陸 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 1、2: 1.OSI系统管理模型主要包含哪几部分?分别简要概述各自的作用。 OSI开放式系统互联通信参考模型 1)OSI系统管理体系结构:基于远程监控的管理,采用数据来抽象地定义网络资源的状态和活动,将网管功能简化为数据库操作功能。 2)CMIP管理信息通信协议:位于应用层,直接为Manager和A 阅读全文
posted @ 2022-05-24 20:27 王陸 阅读(129) 评论(0) 推荐(0) 编辑
摘要: OpenCV-图像特征提取与描述 1 角点特征 学习目标 理解图像的特征 知道图像的角点 1.1 图像的特征 大多数人都玩过拼图游戏。首先拿到完整图像的碎片,然后把这些碎片以正确的方式排列起来从而重建这幅图像。如果把拼图游戏的原理写成计算机程序,那计算机就也会玩拼图游戏了。 在拼图时,我们要寻找一些 阅读全文
posted @ 2022-05-24 20:06 王陸 阅读(802) 评论(0) 推荐(0) 编辑
摘要: 一、问题背景 以二氧化碳浓度数据集为例,该时间序列在某些时间点上会有缺失值。 # 读取数据集 df = pd.read_csv('二氧化碳浓度.csv') # 将字段Datetime数据类型转换为日期类型 df['datetime'] = pd.to_datetime(df['datetime'], 阅读全文
posted @ 2022-05-23 15:21 王陸 阅读(3043) 评论(1) 推荐(1) 编辑
摘要: 1、朴素贝叶斯 朴素贝叶斯是一种基于贝叶斯定理和特征条件独立假设的分类算法。 简单而言,对于给定的训练数据,朴素贝叶斯先基于特征条件独立假设学习输入和输出的联合概率分布,然后基于此分布对于新的实例,利用贝叶斯定理计算出最大的后验概率。朴素贝叶斯不会直接学习输入输出的联合概率分布,而是通过学习类的先验 阅读全文
posted @ 2022-05-10 09:50 王陸 阅读(1233) 评论(0) 推荐(0) 编辑
摘要: 这篇文章的内容来自B站UP主唐国梁Tommy老师的视频 TensorFlow 2.0 基于LSTM多变量_共享单车使用量预测: https://www.bilibili.com/video/BV1y5411K7NR 案例实现思路: 模块导入 加载数据集、预处理 数据可视化 数据预处理 特征工程 模型 阅读全文
posted @ 2022-05-04 12:48 王陸 阅读(3734) 评论(1) 推荐(0) 编辑
摘要: 这篇文章的内容来自B站UP主唐国梁Tommy老师的视频 TensorFlow 2.0 基于LSTM单变量预测_电力消耗案例: https://www.bilibili.com/video/BV1f5411K7qD 案例实现思路: 模块导入 加载数据集、预处理 特征工程 构建模型 模型编译、训练、验证 阅读全文
posted @ 2022-05-03 19:28 王陸 阅读(1865) 评论(0) 推荐(0) 编辑
摘要: 这篇文章的内容来自B站UP主“梗直哥丶 ”的视频 《【循环神经网络】5分钟搞懂RNN,3D动画深入浅出: https://www.bilibili.com/video/BV1z5411f7Bm 《【LSTM长短期记忆网络】3D模型一目了然: https://www.bilibili.com/vide 阅读全文
posted @ 2022-04-28 20:38 王陸 阅读(560) 评论(0) 推荐(0) 编辑
摘要: 第六章 循环神经网络 本节主要内容:讲解卷积神经网络,利用基础CNN、LeNet、AlexNet、VGGNet、InceptionNet和ResNet实现图像识别。 本节目标:学习循环神经网络,用 RNN、LSTM、GRU实现连续数据的预测(以股票预测为例) 1 卷积神经网络与循环神经网络简单对比 阅读全文
posted @ 2022-04-26 21:11 王陸 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 第五章 卷积神经网络 本节主要内容:讲解卷积神经网络,利用基础CNN、LeNet、AlexNet、VGGNet、InceptionNet和ResNet实现图像识别。 1 全连接网络回顾 全连接NN特点:每个神经元与前后相邻层的每一个神经元都有连接关系。(可以实现分类和预测) 全连接网络的参数个数为: 阅读全文
posted @ 2022-04-22 21:53 王陸 阅读(494) 评论(0) 推荐(0) 编辑
摘要: 第四章 神经网络优化 1 回顾 1.1 tf.keras 搭建神经网络八股——六步法 import——导入所需的各种库和包 x_train, y_train——导入数据集、自制数据集、数据增强 model=tf.keras.models.Sequential /class MyModel(Model 阅读全文
posted @ 2022-04-22 19:01 王陸 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 第三章 神经网络搭建八股 1 tf.keras 搭建网络八股 1.1 keras 简介 tf.keras 是 tensorflow2 引入的高封装度的框架,可以用于快速搭建神经网络模型,keras 为支持快速实验而生,能够把想法迅速转换为结果,是深度学习框架之中最终易上手的一个,它提供了一致而简洁的 阅读全文
posted @ 2022-04-22 18:59 王陸 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 第二章 神经网络优化 1 神经网络复杂度 NN复杂度:多用NN层数和NN参数的个数表示 1.1 时间复杂度 即模型的运算次数,可用浮点运算次数(FPLOPs, FLoating-point OPerations)或者乘加运算次数衡 量. 1.2 空间复杂度 空间复杂度(访存量),严格来讲包括两部分: 阅读全文
posted @ 2022-04-19 15:44 王陸 阅读(590) 评论(0) 推荐(1) 编辑
摘要: 第一章 神经网络计算过程及模型搭建 1 人工智能三学派 我们常说的人工智能,就是让机器具备人的思维和意识。人工智能主要有三个学派,即行为主义、符号主义和连接主义。 **行为主义:**是基于控制论的,是在构建感知、动作的控制系统。单脚站立是行为主义一个典型例子,通过感知要摔倒的方向,控制两只手的动作, 阅读全文
posted @ 2022-04-19 15:32 王陸 阅读(401) 评论(0) 推荐(1) 编辑
摘要: 一、数据平稳性与差分法 1.1 平稳性 平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段期间内仍能顺着现有的形态“惯性”地延续下去 平稳性要求序列的均值和方差不发生明显变化 1.2 严平稳与弱平稳 严平稳:严平稳表示的分布不随时间的改变而改变。 如:白噪声(正态),无论怎么取,都是期望为0 阅读全文
posted @ 2022-04-18 15:42 王陸 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 第一章 Zabbix 入门 1.1 Zabbix 概述 Zabbix 是一款能够监控各种网络参数以及服务器健康性和完整性的软件。Zabbix 使用灵活的通知机制,允许用户为几乎任何事件配置基于邮件的告警,这样可以快速反馈服务器的问题。基于已存储的数据,Zabbix 提供了出色的报告和数据可视化功能。 阅读全文
posted @ 2022-04-17 15:00 王陸 阅读(753) 评论(0) 推荐(0) 编辑
摘要: 第五章 DataStream API Flink有非常灵活的分层 API设计,其中的核心层就是 DataStream/DataSet API。由于**新版本已经实现了流批一体, DataSet API将被弃用,官方推荐统一使用 DataStream API处理流数据和批数据。**由于内容较多,我们将 阅读全文
posted @ 2022-04-09 13:06 王陸 阅读(1077) 评论(0) 推荐(1) 编辑
摘要: 一、前后端分离接口文档 SSMUSER服务器接口说明文档 服务器地址 http://localhost:8082 http://127.0.0.1:8082 数据接口说明 根据条件分页获取分页数据 url /user/selectUserPage?userName=z&userSex=男&page= 阅读全文
posted @ 2022-04-08 14:11 王陸 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 第五章 卷积神经网络(CNN) 卷积神经网络是一种具有局部连接、权重共享等特性的深层前馈神经网络。 在用全连接前馈网络来处理图像时,会出现的问题: 参数太多;导致训练效率降低,容易出现过拟合; 需要进行数据增强来提取局部不变性特征(图像的平移、旋转、缩放等操作)。 全连接前馈网络很难提取这些局部不变 阅读全文
posted @ 2022-04-02 21:35 王陸 阅读(550) 评论(0) 推荐(0) 编辑
摘要: 一、Stream流介绍 1.1 集合处理数据的弊端 当我们需要对集合中的元素进行操作的时候,除了必需的添加、删除、获取外,最典型的就是集合遍历。我们来体验 集合操作数据的弊端,需求如下: 一个ArrayList集合中存储有以下数据: 张无忌,周芷若,赵敏,张强,张三丰 需求: 1.拿到所有姓张的 2 阅读全文
posted @ 2022-04-02 16:03 王陸 阅读(1416) 评论(0) 推荐(2) 编辑
摘要: 第四章 前馈神经网络 **人工神经网络(ANN):**指一系列受生物学和神经科学启发的数学模型。简称为神经网络(NN)or神经模型。 连接主义模型: 最早的连接主义模型:20世纪80年代后期,分布式并行处理模型(PDP); ​ 特点: (1)信息表示是分布式的(非局部的) (2)记忆和知识是存储在单 阅读全文
posted @ 2022-03-29 20:51 王陸 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 一、正向传播 正向传播(FP - Forward Propagation) 前一层的输出作为后一层的输入的逻辑结构,每一层神经元仅与下一层的神经元全连接,通过增加神经网络的层数虽然可为其提供更大的灵活性,让网络具有更强的表征能力,也就是说,能解决的问题更多,但随之而来的数量庞大的网络参数的训练,一直 阅读全文
posted @ 2022-03-27 13:48 王陸 阅读(476) 评论(0) 推荐(0) 编辑
摘要: 第三章 线性模型 线性模型(Linear Model)是机器学习中应用最广泛的模型,指通过样本特征的线性组合来进行预测的模型。 线性模型:\(f(x;\theta)=w^Tx+b\) 决策函数(非线性):在分类问题中$y=g(f(x;\theta)),f(x;\theta)$ 也称为判别函数; 符号 阅读全文
posted @ 2022-03-24 20:07 王陸 阅读(462) 评论(2) 推荐(2) 编辑
摘要: 一、回溯法理论基础 1.1 回溯法解决的问题 回溯法,一般可以解决如下几种问题: 组合问题:N个数里面按一定规则找出k个数的集合 切割问题:一个字符串按一定规则有几种切割方式 子集问题:一个N个数的集合里有多少符合条件的子集 排列问题:N个数按一定规则全排列,有几种排列方式 棋盘问题:N皇后,解数独 阅读全文
posted @ 2022-03-20 19:02 王陸 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 第 一 章 Canal 入门 1.1 什么是 Canal 阿里巴巴 B2B 公司,因为业务的特性,卖家主要集中在国内,买家主要集中在国外,所以衍生出了同步杭州和美国异地机房的需求,从 2010 年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业 阅读全文
posted @ 2022-03-20 14:49 王陸 阅读(1859) 评论(1) 推荐(0) 编辑
摘要: 第三章 线性模型 线性模型(Linear Model)是机器学习中应用最广泛的模型,指通过样本特征的线性组合来进行预测的模型。 线性模型:\(f(x;\theta)=w^Tx+b\) 决策函数(非线性):在分类问题中$y=g(f(x;\theta)),f(x;\theta)$ 也称为判别函数; 符号 阅读全文
posted @ 2022-03-15 18:57 王陸 阅读(88) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 29 下一页