05 2019 档案

摘要:原文链接:http://tecdat.cn/?p=6663 此示例中,神经网络用于使用2011年4月至2013年2月期间的数据预测都柏林市议会公民办公室的能源消耗。 每日数据是通过总计每天提供的15分钟间隔的消耗量来创建的。 LSTM简介 LSTM(或长期短期存储器网络)允许分析具有长期依赖性的顺序 阅读全文
posted @ 2019-05-24 17:51 拓端tecdat 阅读(1418) 评论(0) 推荐(0) 编辑
摘要:可视化已成为数据科学在电信行业中的关键应用。具体而言,电信分析高度依赖于地理空间数据的使用。 这是因为电信网络本身在地理上是分散的,并且对这种分散的分析可以产生关于网络结构,消费者需求和可用性的有价值的见解。 数据 为了说明这一点,使用k均值聚类算法来分析纽约市免费公共WiFi的地理数据。该数据集可 阅读全文
posted @ 2019-05-24 17:50 拓端tecdat 阅读(633) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6762 时间序列预测,ARIMA等传统模型通常是一种流行的选择。虽然这些模型可以证明具有高度的准确性,但它们有一个主要缺点 - 它们通常不会解释“冲击”或时间序列的突然变化。让我们看看我们如何使用称为卡尔曼滤波器的模型来潜在地缓解这个问题。 时间序 阅读全文
posted @ 2019-05-24 17:49 拓端tecdat 阅读(702) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6632 我将建立道琼斯工业平均指数(DJIA)日交易量对数比的ARMA-GARCH模型。 获取数据 load(file='DowEnvironment.RData') 日交易量 每日交易量内发生的 变化。 plot(dj_vol) ​ 首先,我们验 阅读全文
posted @ 2019-05-24 17:49 拓端tecdat 阅读(1005) 评论(0) 推荐(0) 编辑
摘要:Wesnoth之战是一款开源的回合制策略游戏。游戏世界很丰富,有几个派系,地图和数百个可用单位。在本教程中,您将学习如何将中等大小的数据集(如游戏元数据)转换为有用的格式,以便使用R进行进一步分析。 您将了解整洁数据集遵循的关键原则,为什么跟踪它们有用,以及如何清理您给出的数据。整理也是了解新数据集 阅读全文
posted @ 2019-05-24 17:48 拓端tecdat 阅读(272) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6863 背景 诸如核密度估计(KDE)的平滑方法被用于控制用于计算每种疾病率的空间支持的群体基础。平滑程度由用户定义的参数(带宽或阈值)控制,该参数影响疾病图的分辨率和计算的速率的可靠性。 方法 内核,带宽的大小,是影响在KDE [在地图上的平滑的 阅读全文
posted @ 2019-05-23 18:48 拓端tecdat 阅读(727) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6592 维度降低有两个主要用例:数据探索和机器学习。它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本。然后可以使用这种可视化来从数据获得见解(例如,检测聚类并识别异常值)。对于机器学习,降维是有用的,因为在拟合过程中使用较 阅读全文
posted @ 2019-05-23 18:28 拓端tecdat 阅读(2108) 评论(0) 推荐(0) 编辑
摘要:统计测试最常见的领域之一是测试列联表中的独立性。在这篇文章中,我将展示如何计算列联表,我将在列联表中引入两个流行的测试:卡方检验和Fisher精确检验。 什么是列联表? 列联表提供关于两个分类变量的测量的整数计数。最简单的列联表是一个2 × 22×2 频率表,由两个变量产生,每个变量有两个级别: 组 阅读全文
posted @ 2019-05-23 18:23 拓端tecdat 阅读(3124) 评论(0) 推荐(0) 编辑
摘要:如果您已经熟悉RStan,那么您需要组合的基本概念是具有相关随机斜率和异方差误差的标准多级模型。 我将R代码嵌入到演示中。所需的包是lavaan,lme4和RStan。 我喜欢将大多数统计方法理解为回归模型。这样,很容易理解大量技术背后的主张。这是一种适用于多级,SEM和IRT模型的方法。在这里,我 阅读全文
posted @ 2019-05-23 18:22 拓端tecdat 阅读(1145) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6751 模拟回归模型的数据 验证回归模型的首选方法是模拟来自它们的数据,并查看模拟数据是否捕获原始数据的相关特征。感兴趣的基本特征是平均值。我喜欢这种方法,因为它可以扩展到广义线性模型(logistic,Poisson,gamma,...)和其他回 阅读全文
posted @ 2019-05-23 18:21 拓端tecdat 阅读(838) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6193 copula是将多变量分布函数与其边际分布函数耦合的函数,通常称为边缘或简单的边缘。Copula是建模和模拟相关随机变量的绝佳工具。 Copula的主要吸引力在于,通过使用它们,您可以分别对相关结构和边缘(即每个随机变量的分布)进行建模。 阅读全文
posted @ 2019-05-23 18:20 拓端tecdat 阅读(2261) 评论(0) 推荐(0) 编辑
摘要:神经网络一直是迷人的机器学习模型之一,不仅因为花哨的反向传播算法,而且还因为它们的复杂性(考虑到许多隐藏层的深度学习)和受大脑启发的结构。 神经网络并不总是流行,部分原因是它们在某些情况下仍然存在计算成本高昂,部分原因是与支持向量机(SVM)等简单方法相比,它们似乎没有产生更好的结果。然而,神经网络 阅读全文
posted @ 2019-05-23 18:20 拓端tecdat 阅读(1876) 评论(0) 推荐(0) 编辑
摘要:参数检验受制于数据属性的假设。例如,学生t检验是众所周知的参数检验,假设样本均值具有正态分布。由于中心极限定理,如果样本量足够,测试也可以应用于非正态分布的测量。在这里,我们将研究t检验有效所需的大致样本数。 将正态分布拟合到采样均值 为了研究满足学生t检验要求所需的样本数量,我们迭代各种样本量。对 阅读全文
posted @ 2019-05-23 18:19 拓端tecdat 阅读(445) 评论(0) 推荐(0) 编辑
摘要:R语言代写是否应对二分连续变量执行逻辑回归 阅读全文
posted @ 2019-05-23 18:19 拓端tecdat 阅读(221) 评论(0) 推荐(0) 编辑
摘要:什么是检验对? 检验对的形式 (x1,x2)(X1,X2) 出现在两种情况中: 对同一实体执行两次测量。例如,一项评估新型胰岛素疗效的临床研究将为每位患者测量两次血糖水平:之前(X1X1)服药后(X2X2)。 对不同的实体进行测量。但是,实体根据其特征进行匹配。例如,为了测试药物的功效,您可能希望根 阅读全文
posted @ 2019-05-23 18:18 拓端tecdat 阅读(248) 评论(0) 推荐(0) 编辑
摘要:原文链接http://tecdat.cn/?p=2657 本文展示了如何基于基础ARMA-GARCH过程(当然这也涉及广义上的QRM)来拟合和预测风险价值(Value-at-Risk,VaR)。 library(qrmtools)# for qq_plot() library(rugarch) 模拟 阅读全文
posted @ 2019-05-07 15:30 拓端tecdat 阅读(1582) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6236 ROC 曲线可能是评估评分分类器的预测性能的最常用的度量。 预测正类(+1)和负类(-1)的分类器的混淆矩阵具有以下结构: 预测/参考类+1-1 +1 TP FP -1 FN TN 这里,TP表示真阳性的数量(模型正确预测正类),FP表示误 阅读全文
posted @ 2019-05-06 18:36 拓端tecdat 阅读(587) 评论(0) 推荐(0) 编辑
摘要:判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。 本文主要关注LDA,并探讨其在理论和实践中作为分类和可视化技术的用途。由于QDA 阅读全文
posted @ 2019-05-06 18:31 拓端tecdat 阅读(1334) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5689 判别分析包括可用于分类和降维的方法。线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术。二次判别分析(QDA)是LDA的变体,允许数据的非线性分离。最后,正则化判别分析(RDA)是LDA和QDA之间的折衷。 本文主要关注LDA, 阅读全文
posted @ 2019-05-06 18:20 拓端tecdat 阅读(2926) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5919 在本文中,我将介绍ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型如何用于预测给定的时间序列数据。 使用后移运算符计算滞后差异 我们可以使用backshift运算符来执行计算。例如,后轴运算符可用于计算的时间序 阅读全文
posted @ 2019-05-06 17:55 拓端tecdat 阅读(1504) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=3172 在这篇文章中,我们将探索比较两组依赖(即成对)定量数据的测试:Wilcoxon符号秩检验和配对学生t检验。这些测试之间的关键区别在于Wilcoxon的测试是非参数测试,而t测试是参数测试。在下文中,我们将探讨这种差异的后果。 睡眠数据集 我 阅读全文
posted @ 2019-05-06 17:23 拓端tecdat 阅读(2289) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示