摘要: 如果想知道一个序列是否对预测另一个序列有用,可以用Granger causality test(格兰杰因果检验)。 Granger causality test的思想 如果使用时间序列X和Y的历史值来预测Y的当前值,比仅通过Y的历史值来预测Y的当前值得到的误差更小,并且通过了F检验,卡方检验,则X对 阅读全文
posted @ 2020-07-01 17:44 泡泡茶壶i 阅读(1436) 评论(0) 推荐(0) 编辑
摘要: 本文介绍一种方法,帮助我们了解一个时间序列是否可以预测,或者说了解可预测能力有多强。 Sample Entropy (样本熵) Sample Entropy是Approximate Entropy(近似熵)的改进,用于评价波形前后部分之间的混乱程度, 熵越大,乱七八糟的波动越多,越不适合预测;熵越小 阅读全文
posted @ 2020-07-01 17:42 泡泡茶壶i 阅读(577) 评论(0) 推荐(0) 编辑
摘要: 经典的时间序列预测方法都是假设如果一个时间序列有显著的自相关性,那么历史值对预测当前值会很有帮助,但是究竟取多少阶的历史值,就需要通过分析相关函数图和偏相关函数图来得到。本文介绍如何什么是相关函数图和偏相关函数图,另外还会介绍一下滞后图。 什么是自相关和偏自相关函数? 先来解释下滞后阶数n,如果当前 阅读全文
posted @ 2020-07-01 17:41 泡泡茶壶i 阅读(1034) 评论(0) 推荐(0) 编辑
摘要: 有的时候,一些时刻或连续时间段内的值无法采集到,或者本身就没有值,本文将介绍如何处理这种情况。 一般而言,有以下几种方法: 对所有的缺失值用零填充。 前向填充:比如用周一的值填充缺失的周二的值 后向填充:比如用周二的值填充缺失的周一的值 采用n最近邻均值法填充:比如n取2,则用t-2,t-1,t+1 阅读全文
posted @ 2020-07-01 17:40 泡泡茶壶i 阅读(346) 评论(0) 推荐(0) 编辑
摘要: Stationary Series 平稳序列 平稳序列有三个基本标准: 1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。 2、序列的方差(variance)不应该是时间的函数。这种特性称为homosced 阅读全文
posted @ 2020-07-01 17:39 泡泡茶壶i 阅读(425) 评论(0) 推荐(0) 编辑
摘要: 在初始概念篇中,我们简单提到了时间序列由趋势、周期性、季节性、误差构成,本文将介绍如何将时间序列的这些成分分解出来。分解的使用场景有很多,比如当我们需要计算该时间序列是否具有季节性,或者我们要去除该时间序列的趋势和季节性,让时间序列变得平稳时都会用到时间序列分解。 加法和乘法时间序列 时间序列的各个 阅读全文
posted @ 2020-07-01 17:38 泡泡茶壶i 阅读(345) 评论(0) 推荐(0) 编辑
摘要: 读取 时间序列数据一般用cvs等电子表格的形式存储,这里以cvs为例: from dateutil.parser import parse from datetime import datetime import matplotlib as mpl import matplotlib.pyplot 阅读全文
posted @ 2020-07-01 17:37 泡泡茶壶i 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 什么是时间序列? 时间序列,是指同一个变量在连续且固定的时间间隔上的各个数据点的集合,比如每5分钟记录的收费口车流量,或者每年记录的药物销量都是时间序列。 时间序列的类型 根据时间间隔的不同,时间序列可以是按年度(Annual)、季度、月度、周、小时、分钟、秒等频率采集的序列。 时间序列的成分 趋势 阅读全文
posted @ 2020-07-01 17:36 泡泡茶壶i 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 转自:https://cloud.tencent.com/developer/article/1646026 航司乘客数序列 预测步骤 # 加载时间序列数据 _ts = load_data() # 使用样本熵评估可预测性 print(f'原序列样本熵:{SampEn(_ts.values, m=2, 阅读全文
posted @ 2020-07-01 17:33 泡泡茶壶i 阅读(397) 评论(0) 推荐(0) 编辑
摘要: 转自:https://cloud.tencent.com/developer/article/1646121 什么是ARIMA? ARIMA是'Auto Regressive Integrated Moving Average'的简称。 ARIMA是一种基于时间序列历史值和历史值上的预测误差来对当前 阅读全文
posted @ 2020-07-01 17:31 泡泡茶壶i 阅读(1538) 评论(0) 推荐(0) 编辑
摘要: 原文作者:AARSHAY JAIN 转自:https://cloud.tencent.com/developer/article/1059136 时间序列(简称TS)被认为是分析领域比较少人知道的技能。(我也是几天前才知道它)。但是你一定知道最近的小型编程马拉松就是基于时间序列发展起来的,我参加了这 阅读全文
posted @ 2020-07-01 17:28 泡泡茶壶i 阅读(2154) 评论(0) 推荐(1) 编辑
摘要: 数据准备 数据集(JetRail高铁的乘客数量)下载. 假设要解决一个时序问题:根据过往两年的数据(2012 年 8 月至 2014 年 8月),需要用这些数据预测接下来 7 个月的乘客数量。 import pandas as pd import numpy as np import matplot 阅读全文
posted @ 2020-07-01 17:25 泡泡茶壶i 阅读(3163) 评论(0) 推荐(0) 编辑
摘要: 在时间序列问题上,机器学习被广泛应用于分类和预测问题。当有预测模型来预测未知变量时,在时间充当独立变量和目标因变量的情况下,时间序列预测就出现了。 预测值可以是潜在雇员的工资或银行账户持有人的信用评分。任何正式引入统计数据的数据科学都会遇到置信区间,这是某个模型确定性的衡量标准。 因此,预测一段时间 阅读全文
posted @ 2020-07-01 17:23 泡泡茶壶i 阅读(642) 评论(0) 推荐(0) 编辑
摘要: InfluxDB作为时序数据库,与传统的关系型数据库相比而言,还是有一些区别的,下面尽量以简单明了的方式介绍下相关的术语概念 I. 基本概念mysql influxdb 说明database database 数据库table measurement 类似mysql中表的概念record tag + 阅读全文
posted @ 2020-07-01 08:52 泡泡茶壶i 阅读(515) 评论(0) 推荐(0) 编辑