01 2022 档案

摘要:原文链接:http://tecdat.cn/?p=24861 原文出处:拓端数据部落公众号 概括 r 语言允许用户计算 lme 4 包中广义线性混合模型的功效。功率计算基于蒙特卡罗模拟。 它包括用于 (i) 对给定模型和设计进行功效分析的工具;(ii) 计算功效曲线以评估功效和样本量之间的权衡。 本 阅读全文
posted @ 2022-01-29 14:02 拓端tecdat 阅读(356) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24852 原文出处:拓端数据部落公众号 “获胜概率”的实时计算(或估计)很困难。我们经常在足球比赛中,在选举中看到这种情况。 考虑经典的多项选择考试。在每个问题之后,想象您尝试计算学生通过考试的概率。在这里考虑我们有 50 个问题的情况。学生在答对 阅读全文
posted @ 2022-01-29 14:00 拓端tecdat 阅读(142) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24842 原文出处:拓端数据部落公众号 谱聚类是一种将数据的相似矩阵的谱应用于降维的技术。它是有用且易于实现的聚类方法。 Scikit-learn API 提供了 谱聚类来实现 Python 中的谱聚类方法。谱聚类 将聚类应用于归一化拉普拉斯算子的 阅读全文
posted @ 2022-01-29 13:59 拓端tecdat 阅读(238) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24814 原文出处:拓端数据部落公众号 说到在股票市场上赚钱,有无数种不同的赚钱方式。似乎在金融界,无论你走到哪里,人们都在告诉你应该学习 Python。毕竟,Python 是一种流行的编程语言,可用于所有类型的领域,包括数据科学。有大量软件包可以 阅读全文
posted @ 2022-01-29 13:58 拓端tecdat 阅读(544) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24777 原文出处:拓端数据部落公众号 使用冗余预测变量构建数据集并使用lasso和 glm识别这些预测变量 。 使用lasso正则化去除冗余预测变量 创建一个X 包含 100 个观测值和 10 个预测变量的随机矩阵 。y 仅使用四个预测变量和少量 阅读全文
posted @ 2022-01-29 13:55 拓端tecdat 阅读(246) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24761 原文出处:拓端数据部落公众号 本文档通过一些探索性数据分析来制定河流的评级曲线和流量预测。目的是利用 (1) 在底部安装单元的定期部署期间测量的瞬时流量和 (2) 来自长期部署在河流中的水位数据记录器的瞬时深度测量,以创建和更新评级曲线。 阅读全文
posted @ 2022-01-25 17:31 拓端tecdat 阅读(276) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24753 原文出处:拓端数据部落公众号 摘要 在这项工作中,我通过创建一个包含四只基金的模型来探索 copula,这些基金跟踪股票、债券、美元和商品的市场指数。然后,我使用该模型生成模拟值,并使用实际收益和模拟收益来测试模型投资组合的性能,以计算风 阅读全文
posted @ 2022-01-25 17:28 拓端tecdat 阅读(229) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24742 原文出处:拓端数据部落公众号 摘要 有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。它们应用于许多不同的领域,例如天文学、生物学、医学或营销。本文给出了这些模型的概述以及许多应用示例。 介绍 有限混合模型是对未观察到的异 阅读全文
posted @ 2022-01-25 17:21 拓端tecdat 阅读(175) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24721 原文出处:拓端数据部落公众号 本文,我通过两个种群生态学家可能感兴趣的例子来说明使用“JAGS”来模拟数据:首先是线性回归,其次是估计动物存活率(公式化为状态空间模型)。 最近,我一直在努力模拟来自复杂分层模型的数据。我现在正在使用 JA 阅读全文
posted @ 2022-01-25 17:19 拓端tecdat 阅读(275) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24694 原文出处:拓端数据部落公众号 本文首先展示了如何将数据导入 R。然后,生成相关矩阵,然后进行两个预测变量回归分析。最后,展示了如何将矩阵输出为外部文件并将其用于回归。 数据输入和清理 首先,我们将加载所需的包。 library(dplyr 阅读全文
posted @ 2022-01-25 17:15 拓端tecdat 阅读(366) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24680 原文出处:拓端数据部落公众号 Beta 假设反映了一种工具对例如市场的风险。但是,您可以通过各种方式估算此度量。 你可以收缩你的估计来稳定它。另一个方面是这种风险度量的非线性。在红色和绿色的时间里,对市场的敏感性不相同。从结果中我们可以看 阅读全文
posted @ 2022-01-24 15:59 拓端tecdat 阅读(106) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24671 原文出处:拓端数据部落公众号 在本文中,我解释了基本回归,并介绍了主成分分析 (PCA) 使用回归来预测城市中观察到的犯罪率。我还应用 PCA 创建了一个回归模型,用于使用前几个主成分对相同的犯罪数据进行建模。最后,我对两种模型的结果进行 阅读全文
posted @ 2022-01-24 15:57 拓端tecdat 阅读(297) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24658 原文出处:拓端数据部落公众号 圆填充Circle packing算法 已经开发了大量确定性和随机性的圆填充算法。 RepelLayout 通过成对排斥迭代移动圆圈来搜索非重叠布局。圆的位置被限制在一个矩形区域内。为避免边缘效应,可以将边界 阅读全文
posted @ 2022-01-24 15:56 拓端tecdat 阅读(486) 评论(0) 推荐(0) 编辑
摘要:原文链接: http://tecdat.cn/?p=24647 原文出处:拓端数据部落公众号 背景和定义 线性混合模型假设 N 个受试者的群体是同质的,并且在群体水平上由独特的曲线 Xi(t)β 描述。相比之下,潜在类别混合模型在于假设人口是异质的,并且由 G 潜在类别的受试者组成,其特征是 G 平 阅读全文
posted @ 2022-01-24 15:53 拓端tecdat 阅读(252) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24613 原文出处:拓端数据部落公众号 我们在心理学网络论文中看到的一个问题是,作者有时会对其数据的可视化进行过度解释。这尤其涉及到图形的布局和节点的位置,例如:网络中的节点是否聚集在某些社区。 下面我将详细讨论这个问题,并提供一个关于如何识别网络 阅读全文
posted @ 2022-01-24 15:51 拓端tecdat 阅读(323) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24535 原文出处:拓端数据部落公众号 最近,copula 在仿真模型中变得流行起来。Copulas 是描述变量之间依赖关系的函数,并提供了一种创建分布以对相关多元数据建模的方法。使用 copula,数据分析师可以通过指定边缘单变量分布并选择特定的 阅读全文
posted @ 2022-01-14 18:19 拓端tecdat 阅读(563) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24511 原文出处:拓端数据部落公众号 本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序,并根据其数值水平对面板进行着色。 显示相关矩阵 cor <- cor(ley) leclr <- mat.colr(cor) mtcolr 根据相关 阅读全文
posted @ 2022-01-14 18:17 拓端tecdat 阅读(300) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22956 原文出处:拓端数据部落公众号 数据简介 受第三类错牙合畸形影响的患者(以下牙弓突出为特征),其骨骼不平衡在生命早期就产生,在青春期和骨骼成熟前会变得更加明显。在单个III类患者中早期预测治疗的成功或失败,使其更容易矫正,但仅从少量的形态决 阅读全文
posted @ 2022-01-14 18:15 拓端tecdat 阅读(218) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24498 原文出处:拓端数据部落公众号 在这个例子中,我们考虑马尔可夫转换随机波动率模型。 统计模型 让 是因变量和 未观察到的对数波动率 . 随机波动率模型定义如下 区制变量 遵循具有转移概率的二态马尔可夫过程 表示均值的正态分布 和方差 . B 阅读全文
posted @ 2022-01-14 18:10 拓端tecdat 阅读(186) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=10809 原文出处:拓端数据部落公众号 数据简介 受欢迎程度(简称:流行度)数据集由来自不同班级的学生组成,并且由于每个学生都属于一个唯一的班级,因此它是一个嵌套设计。因变量是“流行度”,它是一个学生自评的受欢迎程度,范围为0-10。预测指标包括学 阅读全文
posted @ 2022-01-14 17:26 拓端tecdat 阅读(186) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23848 原文出处:拓端数据部落公众号 数据简介 该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。数据集的目标是基于数据集中包含的某些诊断测量来诊断性的预测 患者是否患有糖尿病。从较大的数据库中选择这些实例有几个约束条件。尤其是,这里的所有患者都 阅读全文
posted @ 2022-01-05 18:49 拓端tecdat 阅读(1179) 评论(1) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22422 原文出处:拓端数据部落公众号 数据简介 该数据集 滤泡细胞淋巴瘤数据。该数据集由541名疾病早期的滤泡细胞淋巴瘤(I或II)患者组成,并接受单纯放疗(化疗=0)或放疗和化疗的联合治疗(化疗=1)。疾病复发或无反应和缓解期死亡是两个竞争风险 阅读全文
posted @ 2022-01-05 18:48 拓端tecdat 阅读(136) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23544 原文出处:拓端数据部落公众号 数据简介 每年的降雨量数据可能是相当不稳定的。与温度不同,温度通常在四季中表现出明显的趋势,而雨量作为一个时间序列可能是相当不稳定的。夏季的降雨量与冬季的降雨量一样多是很常见的。本数据为某地区1959年11月 阅读全文
posted @ 2022-01-05 18:47 拓端tecdat 阅读(937) 评论(1) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=8522 原文出处:拓端数据部落公众号 数据简介 客户流失是一个金融术语,指的是客户或客户的流失,即客户不再与公司或企业互动。同样,流失率是客户或客户在特定时间段内离开公司的比率。高于某个阈值的流失率会对公司的业务成功产生有形和无形的影响。理想情况下 阅读全文
posted @ 2022-01-05 18:44 拓端tecdat 阅读(543) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=8640 原文出处:拓端数据部落公众号 数据简介 讨论你关心的事情可能很困难。网络暴力骚扰的威胁意味着许多人停止表达自己并放弃寻求不同的意见。平台努力有效地促进对话,导致许多社区限制或完全关闭用户评论。 AI团队正在研究工具,以帮助提高在线评论互动。 阅读全文
posted @ 2022-01-05 18:43 拓端tecdat 阅读(232) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示