04 2022 档案
摘要:原文链接:http://tecdat.cn/?p=10278 原文出处:拓端数据部落公众号 生存分析(也称为工程中的可靠性分析)的目标是在协变量和事件时间之间建立联系。生存分析的名称源于临床研究,其中预测死亡时间,即生存,通常是主要目标。 视频:R语言生存分析原理与晚期肺癌患者分析案例 R语言生存分
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26158 原文出处:拓端数据部落公众号 弹性网络正则化同时应用 L1 范数和 L2 范数正则化来惩罚回归模型中的系数。为了在 R 中应用弹性网络正则化。在 LASSO回归中,我们为 alpha 参数设置一个 '1' 值,并且在 岭回归中,我们将 '
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26147 原文出处:拓端数据部落公众号 本文使用的数据集记录了 1236 名新生婴儿的体重,以及他们母亲的其他协变量。 本研究的目的是测量吸烟对新生儿体重的影响。研究人员需要通过控制其他协变量(例如母亲的体重和身高)来隔离其影响。这可以通过使用多元
阅读全文
摘要:原文链接:http://tecdat.cn/?p=9368 原文出处:拓端数据部落公众号 向量自回归 (VAR) 是一种用于多变量时间序列分析的统计模型,尤其是在变量具有相互影响关系的时间序列中,本视频中我们介绍了向量自回归并在R软件中进行实现。 视频:向量自回归VAR数学原理及R软件经济数据脉冲响
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26124 原文出处:拓端数据部落公众号 赌徒的破产问题是指玩家有获胜的概率p和失败的概率q。例如,让我们来看看一个技能游戏,玩家X可以通过接近目标,以0.6的概率击败玩家Y。游戏开始时,玩家X被分配到5分,玩家Y被分配到10分。每轮游戏后,玩家的积
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26105 原文出处:拓端数据部落公众号 潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。然而,对于给定的数据集,可以根据类的数量、模型结构和轨迹属性得出不同模型的分数。 本文
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26131 原文出处:拓端数据部落公众号 纪录片能够真实、详尽地反映一个地区的风貌,展示经济发展和社会进步。2018年,纪录片发展迅猛,出现了几部大热作品,加之BBC纪录片造假的舆论导向,让人们对纪录片更加关注。本文所用的纪录片数据来自哔哩哔哩网站,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26096 原文出处:拓端数据部落公众号 摘要 我们首先介绍扩展 Rasch 模型的方法论,然后是一般程序描述和应用主题,包括简单的 Rasch 模型、评级量表模型、部分信用模型及其线性扩展。这种线性结构的结合允许对协变量的影响进行建模,并能够分析重
阅读全文
摘要:原文链接:http://tecdat.cn/?p=25957 原文出处:拓端数据部落公众号 介绍 当您处理金融时间序列时,我们通常可以获得相对高频的观察结果。例如,每天进行观察是很常见的。事实上,现在可以获得每小时、分钟、秒甚至毫秒的观测值。 使用的包 有许多软件包可以使我们能够估计波动率模型。我们
阅读全文
摘要:原文链接:http://tecdat.cn/?p=3795 原文出处:拓端数据部落公众号 在本视频中,我们将介绍Lasso套索回归、岭回归等正则化的回归方法的数学原理以及R软件实例。 视频:Lasso回归、岭回归正则化回归数学原理及R软件实例 Lasso回归、岭回归等正则化回归数学原理及R语言实例
阅读全文
摘要:原文链接:http://tecdat.cn/?p=25939 原文出处:拓端数据部落公众号 在之前的文章中,我们研究了许多使用 多输出回归分析的方法。在本教程中,我们将学习如何使用梯度提升决策树GRADIENT BOOSTING REGRESSOR拟合和预测多输出回归数据。对于给定的 x 输入数据,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=25921 原文出处:拓端数据部落公众号 假设调查人员有兴趣检查减肥干预方法的三个组成部分。这三个组成部分是: 记录食物日记(是/否) 增加活动(是/否) 家访(是/否) 调查员计划调查所有 ,实验条件的组合。实验条件为 要执行因子设计,您需要为多个
阅读全文