09 2021 档案
摘要:原文链接: http://tecdat.cn/?p=23848 原文出处:拓端数据部落公众号 决策树是对例子进行分类的一种简单表示。它是一种有监督的机器学习技术,数据根据某个参数被连续分割。决策树分析可以帮助解决分类和回归问题。 决策树算法将数据集分解成更小的子集;同时,相关的决策树也在逐步发展。决
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23855 原文出处:拓端数据部落公众号 进行荟萃分析时,您很可能必须使用通用度量将效果大小计算或转换为效果大小。有多种工具可以执行此操作 。 计算效果大小 R语言涵盖了大多数效果尺寸计算和转换选项,可以让您更好地了解。例如,从t检验中获取效果大小:
阅读全文
摘要:原文链接: http://tecdat.cn/?p=23836 原文出处:拓端数据部落公众号 我们使用R中的igraph包,产生了网络的图形。但是很难将这些图表放到演讲和文章中,因为图表很难根据需要定制。使用igraph中的绘图功能可以得到你想要的结果,但用ggplot对工作更有帮助。所以本文探索了
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23825 原文出处:拓端数据部落公众号 简介 本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具有各种协方差结构的正态混合模型进行参数估计的函数,以及根据这些模型进行模拟的函数。此外,还包括将
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23808 原文出处:拓端数据部落公众号 本文介绍如何根据历史信号/交易制作股票曲线。 让我们以MARKET TIMING与DECISION MOOSE的历史信号为例,为该策略创建股票曲线。 #****************************
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23800 原文出处:拓端数据部落公众号 介绍 由于空气污染对公众健康的不利影响,人们一直非常关注。世界各国的环境部门都通过各种方法(例如地面观测网络)来监测和评估空气污染问题。全球的地面站及时测量了许多空气污染物,例如臭氧、一氧化碳、颗粒物。EPA
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23792 原文出处:拓端数据部落公众号 在最近的一篇文章中,我们展示了一个LSTM模型,通过假近邻(FNN)损失进行正则化,可以用来重建一个非线性动态系统。在这里,我们探讨了同样的技术是如何协助预测的。与 "普通LSTM "相比,FNN-LSTM在
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23785 原文出处:拓端数据部落公众号 概述 最近,我们使用贝叶斯非参数(BNP)混合模型进行马尔科夫链蒙特卡洛(MCMC)推断。 在这篇文章中,我们通过展示如何使用具有不同内核的非参数混合模型进行密度估计。在后面的文章中,我们将采用参数化的广义线
阅读全文
摘要:原文链接:http://tecdat.cn/?p=10809 原文出处:拓端数据部落公众号 数据简介 受欢迎程度(简称:流行度)数据集由来自不同班级的学生组成,并且由于每个学生都属于一个唯一的班级,因此它是一个嵌套设计。因变量是“流行度”,它是一个学生自评的受欢迎程度,范围为0-10。预测指标包括学
阅读全文
摘要:原文链接: http://tecdat.cn/?p=23777 原文出处:拓端数据部落公众号 在我们的数理统计课程中,已经看到了大数定律(这在概率课程中已经被证明),证明 给出一组i.i.d.随机变量 ,其中有 为了直观地看到这种收敛性,我们可以使用 > for(i in 1:20)B[,i]=me
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23759 原文出处:拓端数据部落公众号 简介 两阶段最小二乘法(2SLS)回归拟合的线性模型是一种常用的工具变量估计方法。 本文的主要内容是将各种标准的回归诊断扩展到2SLS。 2SLS估计的回顾 我们需要2SLS回归的一些基本结果来开发诊断方法,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23717 原文出处:拓端数据部落公众号 Logistic回归,也称为Logit模型,用于对二元结果变量进行建模。在Logit模型中,结果的对数概率被建模为预测变量的线性组合。 例子 例1. 假设我们对影响一个政治候选人是否赢得选举的因素感兴趣。结果
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23709 原文出处:拓端数据部落公众号 在经济学中,技术效率是指在既定的投入下产出可增加的能力或在既定的产出下投入可减少的能力。常用度量技术效率的方法是生产前沿分析方法。所谓生产前沿是指在一定的技术水平下,各种比例投入所对应的最大产出集合。而生产前
阅读全文
摘要:原文链接: http://tecdat.cn/?p=23697 原文出处:拓端数据部落公众号 我们使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。mgcv是一个伟大的库,具有丰富的功能,但我们经常发现,默认的诊断图并不令人振奋。特别是偏残差图,功能很强,但不漂亮,残差几乎看不见。我们
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23689 原文出处:拓端数据部落公众号 本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测。 在本文中,你将看到如何使用一个被称为长短时记忆的时间序列模型。LSTM模型很强大,特别是在保留长期记忆方面。在本文中,你将
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23681 原文出处:拓端数据部落公众号 定义 线性混合效应模型与我们已经知道的线性模型有什么不同? 线性混合模型(有时被称为 "多层次模型 "或 "层次模型",取决于上下文)是一种回归模型,它同时考虑了(1)被感兴趣的自变量(如lm())所解释的变
阅读全文
摘要:原文链接: http://tecdat.cn/?p=23652 原文出处:拓端数据部落公众号 本文为读者提供了如何进行贝叶斯回归的基本教程。包括完成导入数据文件、探索汇总统计和回归分析。 在本文中,我们首先使用软件的默认先验设置。在第二步中,我们将应用用户指定的先验,对自己的数据使用贝叶斯。 准备工
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23668 原文出处:拓端数据部落公众号 “随着社会的进步,人们在改善物质生活的同时开始追求精神生活。森林公园是人们远离城市喧嚣、接触大自然的最佳场所。 要点提示 在森林公园里,我们不仅要欣赏自然风光,更要用心去感知和体验,这样的景观感知体验才能让人
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23646 原文出处:拓端数据部落公众号 你可能会问,为什么是copulas?我们指的是数学上的概念。简单地说,copulas是具有均匀边际的联合分布函数。最重要的是,它们允许你将依赖关系与边际分开研究。有时你对边际的信息比对数据集的联合函数的信息更
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23606 原文出处:拓端数据部落公众号 本文考虑一些ARCH(p)过程,例如ARCH(1)。 其中 有一个高斯白噪声 . > for(t in 3:n){ + sigma2[t]=w+a1*epsilon[t-1]^2+a2*epsilon[t-2
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23616 原文出处:拓端数据部落公众号 在这篇文章中,我们将回顾三种提高循环神经网络的性能和泛化能力的高级方法。我们将在一个温度预测问题上演示这三个概念,我们使用来自安装在建筑物屋顶的传感器的数据点的时间序列。 概述 安装在建筑物屋顶的传感器的数据
阅读全文