06 2021 档案

摘要:原文链接:http://tecdat.cn/?p=22886 原文出处:拓端数据部落公众号 这篇文章假定你已经知道如何用igraph库建立一个基本的网络图。 基本上,igraph允许将几种类型的输入转化为一个图形对象,可以使用plot()函数绘制,如下所示。 # 创建数据 network <- gr 阅读全文
posted @ 2021-06-30 20:19 拓端tecdat 阅读(388) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22862 原文出处:拓端数据部落公众号 如何使用Python通过蒙特卡洛模拟自动计算风险值(VaR)来管理投资组合或股票的金融风险。 金融和投资组合风险管理中的VaR? VaR是 "风险价值 "的缩写,是许多公司和银行用来确定其公司内部金融风险水平 阅读全文
posted @ 2021-06-29 01:36 拓端tecdat 阅读(812) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22853 原文出处:拓端数据部落公众号 本文将介绍R中可用于投资组合优化的不同求解器。 通用求解器 通用求解器可以处理任意的非线性优化问题,但代价可能是收敛速度慢。 默认包 包stats(默认安装的基本R包)提供了几个通用的优化程序。 optimi 阅读全文
posted @ 2021-06-29 01:34 拓端tecdat 阅读(482) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22849 原文出处:拓端数据部落公众号 当需要为数据选择最合适的预测模型或方法时,预测者通常将可用的样本分成两部分:内样本(又称 "训练集")和保留样本(或外样本,或 "测试集")。然后,在样本中估计模型,并使用一些误差指标来评估其预测性能。 如果 阅读全文
posted @ 2021-06-29 01:24 拓端tecdat 阅读(462) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22879 原文出处:拓端数据部落公众号 数据集概述 这个数据集常用于数据概述、可视化和聚类模型。它包括三个鸢尾花品种,每个品种有50个样本,以及一些属性。其中一个花种与其他两个花种是线性可分离的,但其他两个花种之间不是线性可分离的。 这个数据集的给 阅读全文
posted @ 2021-06-29 01:22 拓端tecdat 阅读(786) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22838 原文出处:拓端数据部落公众号 问题:使用R中的鸢尾花数据集 (a)部分:k-means聚类使用k-means聚类法将数据集聚成2组。 画一个图来显示聚类的情况使用k-means聚类法将数据集聚成3组。画一个图来显示聚类的情况(b)部分:层 阅读全文
posted @ 2021-06-29 01:18 拓端tecdat 阅读(654) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22828 原文出处:拓端数据部落公众号 主要优化方法的快速概述 我们介绍主要的优化方法。我们考虑以下问题 . 无导数优化方法 Nelder-Mead方法是最著名的无导数方法之一,它只使用f的值来搜索最小值。过程: 设置初始点x1,...,xn+1 阅读全文
posted @ 2021-06-29 01:15 拓端tecdat 阅读(204) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22813 原文出处:拓端数据部落公众号 本教程为读者提供了使用 频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法。本教程使用教育数据例子进行模型的应用。此外,本教 阅读全文
posted @ 2021-06-29 01:12 拓端tecdat 阅读(448) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22805 原文出处:拓端数据部落公众号 为什么需要虚拟变量? 大多数数据都可以用数字来衡量,如身高和体重。然而,诸如性别、季节、地点等变量则不能用数字来衡量。相反,我们使用虚拟变量来衡量它们。 例子:性别 让我们假设x对y的影响在男性和女性中是不同 阅读全文
posted @ 2021-06-29 01:11 拓端tecdat 阅读(623) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22788 原文出处:拓端数据部落公众号 Python计算获得多资产投资组合的风险度量。 关键概念 随着价格的变动,投资经理所持有的市场价值也会发生变化。后者就是所谓的市场风险,衡量它的最流行的方法之一是定义为风险价值。风险本身被看作是实际收益和期望 阅读全文
posted @ 2021-06-29 01:09 拓端tecdat 阅读(677) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22772 原文出处:拓端数据部落公众号 我们经常使用的一个关系性指标是相关性。通过可以利用数据框架和绘图来帮助探索相关关系。 本文先创建了相关关系的关系数据框,然后绘制了关系结构。 库 我们将使用以下库。 library(tidyverse) li 阅读全文
posted @ 2021-06-29 01:07 拓端tecdat 阅读(138) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22762 原文出处:拓端数据部落公众号 主成分分析法是数据挖掘中常用的一种降维算法,是Pearson在1901年提出的,再后来由hotelling在1933年加以发展提出的一种多变量的统计方法,其最主要的用途在于“降维”,通过析取主成分显出的最大的 阅读全文
posted @ 2021-06-29 01:06 拓端tecdat 阅读(303) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22739 原文出处:拓端数据部落公众号 这个例子说明了一个函数拟合的神经网络如何根据测量结果来估计脂肪百分比(BFP) 。 问题:估计脂肪百分比 在这个例子中,我们试图建立一个神经网络来估计一个人的脂肪百分比,这个人由13个物理属性描述。 年龄 体 阅读全文
posted @ 2021-06-29 01:04 拓端tecdat 阅读(187) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22732 原文出处:拓端数据部落公众号 关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中,我将解释如何在R中提取关联规则。关联规则模型适用于交易数据。交易数据的一个例子可以是客户的购 阅读全文
posted @ 2021-06-09 18:51 拓端tecdat 阅读(348) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22721 原文出处:拓端数据部落公众号 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择。根据惩罚项的大小,LASSO将不太相关的预测因子缩小到(可能)零 阅读全文
posted @ 2021-06-09 17:44 拓端tecdat 阅读(894) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22702 原文出处:拓端数据部落公众号 摘要 贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯。还包括总结结果、绘制路径图、后验直方图、自相关图和绘制 阅读全文
posted @ 2021-06-09 17:39 拓端tecdat 阅读(798) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22692 原文出处:拓端数据部落公众号 在过去十年中,人们对高频交易和模型的兴趣成倍增长。虽然我对高频噪音中出现信号的有效性有一些怀疑,但我还是决定使用GARCH模型研究一下收益率的统计模型。与每日和较低频率的收益不同,日内高频数据有某些特殊的特点 阅读全文
posted @ 2021-06-09 17:35 拓端tecdat 阅读(588) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22673 原文出处:拓端数据部落公众号 方法 Prophet异常检测使用了Prophet时间序列预测。基本的Prophet模型是一个可分解的单变量时间序列模型,结合了趋势、季节性和节假日效应。该模型预测还包括一个围绕估计的趋势部分的不确定性区间。另 阅读全文
posted @ 2021-06-09 17:32 拓端tecdat 阅读(1094) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22665 原文出处:拓端数据部落公众号 摘要 状态空间建模是一种高效、灵活的方法,用于对大量的时间序列和其他数据进行统计推断。本文介绍了状态空间建模,其观测值来自指数族,即高斯、泊松、二项、负二项和伽马分布。在介绍了高斯和非高斯状态空间模型的基本理 阅读全文
posted @ 2021-06-09 17:29 拓端tecdat 阅读(344) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22632 原文出处:拓端数据部落公众号 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法。我们将对一种叫做STL的算法进行研究,STL是 "使用LOESS(局部加权回归)的季节-趋势分解 "的缩写,以及如何将其应用于异常检测。 阅读全文
posted @ 2021-06-09 17:28 拓端tecdat 阅读(834) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22643 原文出处:拓端数据部落公众号 就香水市场份额而言,亚洲占全球销售额的8%,仅占拉丁美洲的20%,而中国仅占全球销售额的0.8%。从国际市场角度来看,香水市场是一个438.9亿美元的产业,每年至少有300种新产品推出。 要点提示 在法国,香 阅读全文
posted @ 2021-06-09 17:27 拓端tecdat 阅读(329) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22596 原文出处:拓端数据部落公众号 研究大纲 介绍数据集和研究的目标 探索数据集 可视化 使用Chi-Square独立检验、Cramer's V检验和GoodmanKruskal tau值对数据集进行探索 预测模型,Logisitic回归和Ra 阅读全文
posted @ 2021-06-03 23:29 拓端tecdat 阅读(824) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22588 原文出处:拓端数据部落公众号 今天我们将计算投资组合收益的CAPM贝塔。这需要拟合一个线性模型,得到可视化,从资产收益的角度考虑我们的结果的意义。 简单的背景介绍,资本资产定价模型(CAPM)是由威廉·夏普(William Sharpe) 阅读全文
posted @ 2021-06-03 23:21 拓端tecdat 阅读(778) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22566 原文出处:拓端数据部落公众号 本文是极端值推断的内容。我们在广义帕累托分布上使用最大似然方法。 极大似然估计 在参数模型的背景下,标准技术是考虑似然的最大值(或对数似然)。考虑到一些技术性假设,如 ,的某个邻域,那么 其中表示费雪信息矩阵 阅读全文
posted @ 2021-06-03 23:20 拓端tecdat 阅读(569) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22557 新零售,顾名思义,就是与 传统零售 完全不同的,一种新的零售模式。 要点提示 其价值在于 最大程度提升全社会流通零售业的运转效率。 建立一个以消费者体验 为中心的数据驱动的零售形态。现在新零售已经渗透到我们生活到方方面面,如 无人便利店、 阅读全文
posted @ 2021-06-03 23:19 拓端tecdat 阅读(81) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22546 原文出处:拓端数据部落公众号 资产价格具有随时间变化的波动性(逐日收益率的方差)。在某些时期,收益率是高度变化的,而在其他时期则非常平稳。随机波动率模型用一个潜在的波动率变量来模拟这种情况,该变量被建模为随机过程。下面的模型与 No-U- 阅读全文
posted @ 2021-06-03 23:12 拓端tecdat 阅读(271) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22537 我们在ggplot2中制作的饼实际上是一个条形图转换为极坐标。如果我们想制作一个像上面截图那样的地图,这就很困难了。 但在地图上绘制饼图时,它也有自己的缺点。首先,当我们绘制大量的饼图时,它以光栅图像的形式渲染,使得它的渲染速度很慢。本文 阅读全文
posted @ 2021-06-03 23:07 拓端tecdat 阅读(261) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22617 原文出处:拓端数据部落公众号 本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器。 %matplotli 阅读全文
posted @ 2021-06-03 22:49 拓端tecdat 阅读(534) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22609 原文出处:拓端数据部落公众号 摘要 本文提供了一套用于分析各种有限混合模型的方法。既包括传统的方法,如单变量和多变量正态混合的EM算法,也包括反映有限混合模型的一些最新研究的方法。许多算法都是EM算法或基于类似EM的思想,因此本文包括有限 阅读全文
posted @ 2021-06-03 22:17 拓端tecdat 阅读(309) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22531 原文出处:拓端数据部落公众号 对于线性关系,我们可以进行简单的线性回归。对于其他关系,我们可以尝试拟合一条曲线。 曲线拟合是构建一条曲线或数学函数的过程,它对一系列数据点具有最佳的拟合效果。 使用示例数据集 #我们将使Y成为因变量,X成为 阅读全文
posted @ 2021-06-03 22:16 拓端tecdat 阅读(410) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22521 原文出处:拓端数据部落公众号 在大数据的趋势下,我们经常需要做预测性分析来帮助我们做决定。其中一个重要的事情是根据我们过去和现在的数据来预测未来。这种方法我们通常被称为预测。 许多情况下都需要预测:决定是否在未来五年内再建一座发电站需要对 阅读全文
posted @ 2021-06-03 22:12 拓端tecdat 阅读(356) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22511 原文出处:拓端数据部落公众号 标准的ARIMA(移动平均自回归模型)模型允许只根据预测变量的过去值进行预测。该模型假定一个变量的未来的值线性地取决于其过去的值,以及过去(随机)影响的值。ARIMAX模型是ARIMA模型的一个扩展版本。它还 阅读全文
posted @ 2021-06-03 21:57 拓端tecdat 阅读(322) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22492 原文出处:拓端数据部落公众号 我们将使用葡萄酒数据集进行主成分分析。 数据 数据包含177个样本和13个变量的数据框;vintages包含类标签。这些数据是对生长在意大利同一地区但来自三个不同栽培品种的葡萄酒进行化学分析的结果:内比奥罗、 阅读全文
posted @ 2021-06-03 21:55 拓端tecdat 阅读(744) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22482 原文出处:拓端数据部落公众号 引言 本文是一个简短的教程,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 本教程的目的是帮助你学习如何在R中开发一个BRT模型。 示例数据 有两套短 阅读全文
posted @ 2021-06-01 17:34 拓端tecdat 阅读(449) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22467 原文出处:拓端数据公众号 本文展示了如何使用扩展卡尔曼滤波器进行故障检测。本文使用扩展的卡尔曼滤波器对一个简单的直流电机的摩擦力进行在线估计。估计的摩擦力的重大变化被检测出来,并表明存在故障。 电机模型 电机被模拟成具有阻尼系数c,转动惯 阅读全文
posted @ 2021-06-01 17:31 拓端tecdat 阅读(379) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22458 原文出处:拓端数据部落公众号 简介 本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较。希望对经济和金融领域的从业人员和 阅读全文
posted @ 2021-06-01 17:00 拓端tecdat 阅读(501) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22448 原文出处:拓端数据部落公众号 今天,我们将看下bagging 技术里面的启发式算法。 通常,bagging 与树有关,用于生成森林。但实际上,任何类型的模型都有可能使用bagging 。回顾一下,bagging意味着 "boostrap聚 阅读全文
posted @ 2021-06-01 16:52 拓端tecdat 阅读(124) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22438 原文出处:拓端数据部落公众号 多项式回归是独立x变量和因果y变量之间的非线性关系。 当我们分析有一些弯曲的波动数据时,拟合这种类型的回归是很关键的。 在这篇文章中,我们将学习如何在R中拟合和绘制多项式回归数据。我们在这个回归模型中使用了l 阅读全文
posted @ 2021-06-01 16:24 拓端tecdat 阅读(314) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22422 在本文中,我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率。该模型包含Fine和Gray(1999)的模型作为一个特例。这可以用来对次分布危险的比例假设做拟合度测试(Scheike和Zhang 阅读全文
posted @ 2021-06-01 16:22 拓端tecdat 阅读(379) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22410 原文出处:拓端数据部落公众号 本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。 library(tidyverse) library(broom) 这些数据来自一项正在进行的对镇居民的心血管研究。其目的是预测一个 阅读全文
posted @ 2021-06-01 16:21 拓端tecdat 阅读(596) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22360 原文出处:拓端数据部落公众号 在这篇文章中,我们将学习一种在价格序列中建立波动性模型的标准方法,即广义自回归条件异方差(GARCH)模型。 价格波动的 GARCH 模型的思想是利用误差结构的近期实现来预测误差结构的未来实现。更简单地说,我 阅读全文
posted @ 2021-06-01 16:20 拓端tecdat 阅读(457) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22350 在心理学研究中,个人主体的模型正变得越来越流行。原因之一是很难从人之间的数据推断出个人过程。另一个原因是,由于移动设备无处不在,从个人获得的时间序列变得越来越多。所谓的个人模型建模的主要目标是挖掘潜在的内部心理现象变化。考虑到这一目标,许 阅读全文
posted @ 2021-06-01 16:19 拓端tecdat 阅读(261) 评论(0) 推荐(0) 编辑
摘要:原文 | http://tecdat.cn/?p=22336 来源 | 拓端数据部落公众号 Boosting算法是一种把若干个分类器整合为一个分类器的方法,也就是一种集成分类方法(Ensemble Method)。 计量经济学的视角 可以从计量经济学的角度理解提升方法(Boosting)的内容。这里 阅读全文
posted @ 2021-06-01 16:17 拓端tecdat 阅读(288) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22328 原文出处:拓端数据部落公众号 目前,回归诊断不仅用于一般线性模型的诊断,还被逐步推广应用于广义线性模型领域(如用于logistic回归模型),但由于一般线性模型与广义线性模型在残差分布的假定等方面有所不同,所以推广和应用还存在许多问题。鉴 阅读全文
posted @ 2021-06-01 16:15 拓端tecdat 阅读(362) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示