摘要:
一、滑动平均 公式(窗口为7): 也就是说7个数做一次平均 二、指数平均 公式: 其中 因此 也就是说离本点越近,考虑的权重也越大。 python code: # author: adrian.wu import numpy as np from matplotlib import pyplot a 阅读全文
摘要:
里面的内容不知道怎么写,没深扣,就把字典放进来吧^_^。 绝对零度:所能达到的最低的温度,在这温度下物体不包含热能。 加速度:物体速度改变的速率。 人择原理:我们之所以看到宇宙是这个样子,只是因为如果它不是这样,我们就不会在这里去观察它。 反粒子:每个类型的物质粒子都有与其相对应的反粒子。当一个粒子 阅读全文
摘要:
一、损失函数 1、0~1损失 $$L(y_{i},f(x_{i}))=\begin{Bmatrix}1 & y_{i}\neq f(x_{i})\\ 0& y_{i}=f(x_{i})\end{Bmatrix}$$ 0~1损失简单易于理解,用于分类,如果预测的标签和数据标注的标签一致,那么就为0,否 阅读全文
摘要:
一、时间序列分析 北京每年每个月旅客的人数,上海飞往北京每年的游客人数等类似这种顾客数、访问量、股价等都是时间序列数据。这些数据会随着时间变化而变化。时间序列数据的特点是数据会随时间的变化而变化。 随机过程的特征值有均值、方差、协方差等。如果随机过程的特征随时间变化而变化,那么数据是非平稳的,相反, 阅读全文
摘要:
首先看几个问题 1、实现参数的稀疏有什么好处? 一个好处是可以简化模型、避免过拟合。因为一个模型中真正重要的参数可能并不多,如果考虑所有的参数作用,会引发过拟合。并且参数少了模型的解释能力会变强。 2、参数值越小代表模型越简单吗? 是。越复杂的模型,越是会尝试对所有的样本进行拟合,甚至包括一些异常样 阅读全文
摘要:
1、ACF y(t,s)=E(Xt-µt)(Xs-µs) 定义ρ(t,s)为时间序列的自相关系数,为ACF ρ(t,s)=y(t,s)/sqrt(DXt * DXs) E为期望,D为方差 2、PACF 自相关系数ρ(t,s)并不是只有两个点t和s的数据决定的。而是还包含了t-1 ~ s+1时间段值的 阅读全文
摘要:
1、模型的信息提取 1 # 节点信息提取 2 config = model.get_config() # 把model中的信息,solver.prototxt和train.prototxt信息提取出来 3 model = Model.from_config(config) # 还回去 4 # or, 阅读全文
摘要:
摘自推荐系统 一、描述 有一些指标是可以通过近邻算法给出的 二、指标 1、预测用户u对新物品i的评分rw。 跟用户u相似的用户称为近邻,挑选出足够多的对物品i都评分的近邻用户,然后对新物品进行评分。公式: w代表其它用户和u的相似度,r代表用户v对商品i的评分。用|w|对公式进行标准化,防止负的评分 阅读全文
摘要:
摘自Apache官网 一、State的基本概念 什么叫State?搜了一把叫做状态机制。可以用作以下用途。为了保证 at least once, exactly once,Flink引入了State和Checkpoint 某个task/operator某时刻的中间结果 快照(snapshot) 程序 阅读全文
摘要:
摘自Apache Flink官网 最早的streaming 架构是storm的lambda架构 分为三个layer batch layer serving layer speed layer 一、在streaming中Flink支持的通知时间 Flink官网写了个了解streaming和各种时间的博 阅读全文