02 2022 档案

摘要:原文链接:http://tecdat.cn/?p=25536 原文出处:拓端数据部落公众号 “分位数自回归”,它是对时间序列域的重要扩展。 本教程的数据是痛苦指数,它是一个月频率时间序列,总和:(失业率 + 通货膨胀率)构成所谓的“苦难指数”。 “什么是痛苦指数?就是失业率与通货膨胀率之和”。该指数 阅读全文
posted @ 2022-02-19 21:43 拓端tecdat 阅读(159) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25476 原文出处:拓端数据部落公众号 从广义上讲,我们可以将金融市场状况分为两类:牛市和熊市。第一个是平稳且通常向上倾斜。第二个描述了一个低迷的市场,通常更不稳定。在任何特定时刻,我们只能猜测自己所处的状态;因为这两个状态没有统一准确的定义。 在 阅读全文
posted @ 2022-02-19 21:37 拓端tecdat 阅读(192) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=21317 本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联。 R语言中的分布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例 视频:R语言中的分布滞后非线性模型 阅读全文
posted @ 2022-02-19 21:34 拓端tecdat 阅读(493) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18860 时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据 视频:时间序列分析:ARIMA GARCH模型分析股票价格数据 简介 时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息 阅读全文
posted @ 2022-02-19 21:26 拓端tecdat 阅读(655) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25453 原文出处:拓端数据部落公众号 现在有了对贝叶斯方法的概念理解,我们将实际研究使用它的回归模型。为了简单起见,我们从回归的标准线性模型开始。然后添加对采样分布或先验的更改。我们将通过 R 和相关的 R 包 rstan 使用编程语言 Stan 阅读全文
posted @ 2022-02-19 21:21 拓端tecdat 阅读(201) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25428 原文出处:拓端数据部落公众号 介绍 本文,我们说明了贝叶斯学习和 计算统计一些结果。 from math import pi from pylab import * 马尔可夫链的不变测度 考虑一个高斯 AR(1) 过程, , 其中 是标准 阅读全文
posted @ 2022-02-19 21:19 拓端tecdat 阅读(321) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25410 原文出处:拓端数据部落公众号 通过训练具有小中心层的多层神经网络重构高维输入向量,可以将高维数据转换为低维代码。这种神经网络被命名为自编码器Autoencoder。 自编码器是非线性降维 技术用于特征的无监督学习,它们可以学习比主成分分析 阅读全文
posted @ 2022-02-12 11:13 拓端tecdat 阅读(397) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25376 原文出处:拓端数据部落公众号 Metropolis-Hastings 算法对概率分布进行采样以产生一组与原始分布成比例的轨迹。 首先,目标是什么?MCMC的目标是从某个概率分布中抽取样本,而不需要知道它在任何一点的确切概率。MCMC实现这 阅读全文
posted @ 2022-02-12 11:11 拓端tecdat 阅读(230) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25348 原文出处:拓端数据部落公众号 你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima、阈值超额法threshold excess。今天,我们将分别介绍这两种方法。 分块极大值Block-maxima 分块样本极大值的 阅读全文
posted @ 2022-02-12 11:10 拓端tecdat 阅读(252) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25220 原文出处:拓端数据部落公众号 当ARIMA模型包括其它时间序列作为输入变量时,被称为传递函数模型(transfer function model)、多变量时间序列模型(multivariate time series model)、ARI 阅读全文
posted @ 2022-02-12 11:08 拓端tecdat 阅读(264) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25196 原文出处:拓端数据部落公众号 目标 对“NCI60”(癌细胞系微阵列)数据使用聚类方法,目的是找出观察结果是否聚类为不同类型的癌症。K_means 和层次聚类的比较。 #数据信息 dim(nata) nci.labs[1:4] table 阅读全文
posted @ 2022-02-05 17:35 拓端tecdat 阅读(201) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25180 原文出处:拓端数据部落公众号 时间序列分析 对于时间序列分析,有两种数据格式: ts (时间序列)和 xts (可扩展时间序列)。前者不需要时间戳,可以直接从向量转换。后者非常重视日期和时间,因此只能使用日期和/或时间列来定义。我们涵盖了 阅读全文
posted @ 2022-02-05 17:34 拓端tecdat 阅读(219) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25165 原文出处:拓端数据部落公众号 这篇文章介绍了一类离散随机波动率模型,并介绍了一些特殊情况,包括 GARCH 和 ARCH 模型。本文展示了如何模拟这些过程以及参数估计。本文为这些实验编写的 Python 代码在文章末尾引用。 离散随机波动 阅读全文
posted @ 2022-02-05 17:32 拓端tecdat 阅读(252) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25158 原文出处:拓端数据部落公众号 本文拟合具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso、组MCP。还提供了进行交叉验证以及拟合后可 阅读全文
posted @ 2022-02-04 13:38 拓端tecdat 阅读(240) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25133 原文出处:拓端数据部落公众号 2017 年年中,R 推出了 Keras 包 ,这是一个在 Tensorflow 之上运行的综合库,具有 CPU 和 GPU 功能。本文将演示如何在 R 中使用 LSTM 实现时间序列预测。 简单的介绍 时间 阅读全文
posted @ 2022-02-04 13:37 拓端tecdat 阅读(418) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25122 原文出处:拓端数据部落公众号 当一个序列遵循随机游走模型时,就说它是非平稳的。我们可以通过对时间序列进行一阶差分来对其进行平稳化,这将产生一个平稳序列,即零均值白噪声序列。例如,股票的股价遵循随机游走模型,收益序列(价格序列的差分)将遵循 阅读全文
posted @ 2022-02-04 13:35 拓端tecdat 阅读(850) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25111 原文出处:拓端数据部落公众号 分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。数据包含对 5,960 名抵押贷款申请人的观察结果。一个名为的变量 Bad 表示申请人在获得贷款批准后是还清贷款还是拖欠贷款。 此示例构建一个树模型,该 阅读全文
posted @ 2022-02-04 13:34 拓端tecdat 阅读(174) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25086 原文出处:拓端数据部落公众号 今年的收益是否真的与典型年份的预期不同?差异实际上与典型年份的预期不同吗?这些都是容易回答的问题。我们可以使用均值相等或方差相等的测试。但是下面这个问题呢。 今年的收益概况与一般年份的预期情况是否不同? 这是 阅读全文
posted @ 2022-02-04 13:32 拓端tecdat 阅读(93) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25075 原文出处:拓端数据部落公众号 本文显示如何填充 图表中两条交叉线之间的区域。 让我们尝试用ggplot2绘制这个图 . 首先,加载 ggplot2 并生成要在示例中使用的数据框(我使用的是稍微修改过的数据集,因此最终结果会与原始图有所不同 阅读全文
posted @ 2022-02-03 13:31 拓端tecdat 阅读(290) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25067 原文出处:拓端数据部落公众号 本文描述了如何 使用R执行主成分分析 ( PCA )。您将学习如何 使用 PCA预测 新的个体和变量坐标。我们还将提供 PCA 结果背后的理论。 在 R 中执行 PCA 有两种通用方法: 谱分解 ,检查变量之 阅读全文
posted @ 2022-02-03 13:30 拓端tecdat 阅读(339) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25044 原文出处:拓端数据部落公众号 1 简介 在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。第一种有时称为“路径分析”,而后者有时称为“测量模型”。 2 进行简单的多元回归 SEM 在很大程度上是回归的多元扩展,我们可以在 阅读全文
posted @ 2022-02-03 13:29 拓端tecdat 阅读(321) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=25007 原文出处:拓端数据部落公众号 在事物的发展过程中,常表现出复杂的波动情况,即时而波动的幅度较缓,而又时常出现波动集聚性(VolatilitY clustering),在风险研究中经常遇到这种情况。恩格尔(Engle)在1982年提出了用来 阅读全文
posted @ 2022-02-03 13:26 拓端tecdat 阅读(265) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24996 原文出处:拓端数据部落公众号 我一直在寻找一种直观的方法来绘制流程中状态之间的流程或连接。一个明显的选择是,R软件包恰好满足了我的需求。 将数据设置为正确的格式是一个比较麻烦的过程。现在,本文仅说明如何构建多级图。 构造数据 此示例的计划 阅读全文
posted @ 2022-02-03 13:25 拓端tecdat 阅读(326) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24983 原文出处:拓端数据部落公众号 本文我们超越了 CAPM 的简单线性回归,探索了 Fama French (FF) 股票风险/收益的多因素模型。 FF 模型通过回归除市场收益之外的几个变量的投资组合收益来扩展 CAPM。从一般数据科学的角度 阅读全文
posted @ 2022-02-02 12:48 拓端tecdat 阅读(651) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24973 原文出处:拓端数据部落公众号 简介 世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病。心血管疾病的早期预后可以帮助决定改变高危患者的生活方式,从而减少并发症。本研究旨在查明心脏病最相 阅读全文
posted @ 2022-02-02 12:47 拓端tecdat 阅读(316) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24956 原文出处:拓端数据部落公众号 绘制分类或回归树的基本方法的 rpart() 函数只是调用 plot。然而,总的来说,结果并不漂亮。事实证明,一段时间以来,有一种更好的方法来绘制 rpart() 树。 我们可以大概浏览下如何实现,并且进一步 阅读全文
posted @ 2022-02-02 12:46 拓端tecdat 阅读(107) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24947 原文出处:拓端数据部落公众号 本案例研究说明了卡尔曼滤波器的设计和仿真。考虑稳态和时变卡尔曼滤波器。 植物动力学 考虑一个在输入u[n]上有加性高斯噪声w[n]。 此外,让 yv[n] 是输出 y[n] 的噪声测量,其中 v[n] 表示测 阅读全文
posted @ 2022-02-02 12:44 拓端tecdat 阅读(176) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24940 原文出处:拓端数据部落公众号 变量选择是高维统计建模的重要组成部分。许多流行的变量选择方法,例如 LASSO,都存在偏差。带平滑削边绝对偏离(smoothly clipped absolute deviation,SCAD)正则项的回归问 阅读全文
posted @ 2022-02-02 12:43 拓端tecdat 阅读(573) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24896 原文出处:拓端数据部落公众号 漂亮的圆形图。我不确定对数据分析师本身是否有额外的好处,但如果能吸引决策者的注意,那对我来说就是额外的价值。 然而,用coord_polar()或偶尔发现的ggplot2中的coord_radar()构建它们 阅读全文
posted @ 2022-02-01 11:16 拓端tecdat 阅读(563) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24925 原文出处:拓端数据部落公众号 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观 阅读全文
posted @ 2022-02-01 11:16 拓端tecdat 阅读(198) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24906 原文出处:拓端数据部落公众号 你知道“巨型猪饲料”“单身狗粮”是什么吗?这不是给动物吃的,也许你或多或少听说过,这些在网上引起巨大反响的零食,完全激起了大家的购买欲望。 要点提示 与传统食品相比,这种购物模式不需要消费者亲自到商店或市场去 阅读全文
posted @ 2022-02-01 11:14 拓端tecdat 阅读(52) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24875 原文出处:拓端数据部落公众号 支持向量回归(SVR)是一种回归算法,它应用支持向量机(SVM)的类似技术进行回归分析。正如我们所知,回归数据包含连续的实数。为了拟合这种类型的数据,SVR模型在考虑到模型的复杂性和错误率的情况下,用一个叫做 阅读全文
posted @ 2022-02-01 11:12 拓端tecdat 阅读(703) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24886 原文出处:拓端数据部落公众号 在网络上进行社区检测时,有时我们不仅拥有实体之间的联系。这些实体代表了我们可能也想在网络可视化中代表的现实事物。 plot(g) 我使用数据集,代表了观察到的 18 位女性参加 14 场社交活动的情况。 不考 阅读全文
posted @ 2022-02-01 11:12 拓端tecdat 阅读(169) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示