08 2021 档案

摘要:原文链接:http://tecdat.cn/?p=23599 原文出处:拓端数据部落公众号 降维是在我们处理包含过多特征数据的大型数据集时使用的,提高计算速度,减少模型大小,并以更好的方式将巨大的数据集可视化。这种方法的目的是保留最重要的数据,同时删除大部分的特征数据。 在这个教程中,我们将简要地学 阅读全文
posted @ 2021-08-28 12:16 拓端tecdat 阅读(439) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23583 原文出处:拓端数据部落公众号 作者:Herbert Hu 项目挑战 无印良品,是指“没有名字的优良商品”,于1980年诞生于日本,主推服装、生活杂货、食品等各类优质商品。2005年,无印良品进入中国市场,产品注重纯朴、简洁、环保、以人为本 阅读全文
posted @ 2021-08-28 12:15 拓端tecdat 阅读(299) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23573 原文出处:拓端数据部落公众号 我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。 在这篇文章中,我们将简要地学习如何用Python中的Keras神经网络API拟合回归数据。我们将用Keras回归和序列模型本身这两种方法检查模 阅读全文
posted @ 2021-08-28 12:14 拓端tecdat 阅读(490) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23564 原文出处:拓端数据部落公众号 环境应激源往往表现出时间上的滞后效应,这就要求使用足够灵活的统计模型来描述暴露-反应关系的时间维度。在此,我们开发了分布式滞后非线性模型(DLNM),这是一个可以同时代表非线性暴露-反应依赖性和滞后效应的建模 阅读全文
posted @ 2021-08-28 12:13 拓端tecdat 阅读(381) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23558 原文出处:拓端数据部落公众号 本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR(1)模拟时间序列 > for(t in 2:n) X[t]=phi*X[t-1]+E[t] > plot(X,type="l") 如果我们拟合一个A 阅读全文
posted @ 2021-08-28 12:12 拓端tecdat 阅读(398) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23551 原文出处:拓端数据部落公众号 什么是跳跃扩散(Jump Diffusion)? 跳跃扩散模型是一种用来对期权合约进行估价或定价的模型,它混合了两种定价技术:一种是更传统的扩散模型,在这种模型中,因素以平稳和相对一致的方式发挥作用;另一种是 阅读全文
posted @ 2021-08-28 12:11 拓端tecdat 阅读(263) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23544 原文出处:拓端数据部落公众号 下面是一个关于如何使用长短期记忆网络(LSTM)来拟合一个不稳定的时间序列的例子。 每年的降雨量数据可能是相当不稳定的。与温度不同,温度通常在四季中表现出明显的趋势,而雨量作为一个时间序列可能是相当不稳定的。 阅读全文
posted @ 2021-08-28 12:10 拓端tecdat 阅读(501) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23534 作者:ShiChao Wu 项目挑战 肝脏病在早期可能没有任何症状,不容易被察觉,或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关,肝脏病的一般是通过肝功能测试诊断。在常见的肝功能测试诊断中,一般主要包含三大类指标:血清酶、胆红 阅读全文
posted @ 2021-08-24 16:53 拓端tecdat 阅读(257) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23524 原文出处:拓端数据部落公众号 在本文中,我想向你展示如何使用R的Metropolis采样从贝叶斯Poisson回归模型中采样。 Metropolis-Hastings算法 Metropolis-Hastings抽样算法是一类马尔科夫链蒙特 阅读全文
posted @ 2021-08-24 16:52 拓端tecdat 阅读(199) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23509 原文出处:拓端数据部落公众号 我们在研究工作中使用广义加性模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。 这篇文章介绍一下广义加性模型(GAMs)目前可以实现的功能。 我们需要加载mgc 阅读全文
posted @ 2021-08-24 16:51 拓端tecdat 阅读(736) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23518 原文出处:拓端数据部落公众号 项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。银行拥有不断增长的客户。该银行希望增加借款人(资产客户),开展更多的贷款业务,并通过贷款利息赚取更多利润。因此,银 阅读全文
posted @ 2021-08-24 16:51 拓端tecdat 阅读(138) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23490 原文出处:拓端数据部落公众号 本文介绍了冲积/桑基图,以及 定义了命名方案和冲积/桑基图的基本组成部分(轴、冲积层、流)。 描述了所识别的冲积/桑基图数据结构。 展示了一些流行的主题。 冲积/桑基图 这里有一个典型的冲积/桑基图。 现在, 阅读全文
posted @ 2021-08-24 16:50 拓端tecdat 阅读(264) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23476 原文出处:拓端数据部落公众号 作者:Enzo Li 项目挑战 开发一个预测模型,根据一个国家的历史每日COVID-19确诊病例,预测接下来115天当地的每日新增确诊病例。 解决方案 任务/目标 采用多种预测模型实现预测,评估每种模型的性能 阅读全文
posted @ 2021-08-24 16:49 拓端tecdat 阅读(207) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23485 原文出处:拓端数据部落公众号 用于R语言的多层感知器(MLP)和极限学习机(ELM)进行时间序列预测。请注意,由于神经网络无法利用GPU处理,因此大型网络的训练速度往往很慢。与现有神经网络实现的不同之处在于,R可以自动设计具有合理预测性能 阅读全文
posted @ 2021-08-24 16:49 拓端tecdat 阅读(437) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23449 原文出处:拓端数据部落公众号 本文回答了关于逻辑回归的问题:它与线性回归有什么不同,如何在R中用glm()函数拟合和评估这些模型等等? Logistic回归是机器学习从统计学领域的一种技术。它是用一个或多个解释变量对二项式结果进行建模的一 阅读全文
posted @ 2021-08-24 16:48 拓端tecdat 阅读(307) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23440 原文出处:拓端数据部落公众号 你知道吗,你可以把普通的静态ggplot图转换成动画图?在R软件包ganimate的帮助下,你可以做到这一点,而且效果非常好。对所有类型的几何图形都能毫不费力地转化为超级流畅的动画,让我和我的同事印象非常深刻 阅读全文
posted @ 2021-08-24 16:47 拓端tecdat 阅读(197) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23392 原文出处:拓端数据部落公众号 作者:Minghong Xu 某制药公司每年要花费大量的资金在电费上,由于电力公司的业务改革,该药企可以在一年或月开始时向电力公司预购一定数量的电力,如果实际消耗大于该值,则每多消耗一度电要付比以前更多的电费 阅读全文
posted @ 2021-08-14 22:47 拓端tecdat 阅读(49) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23426 原文出处:拓端数据部落公众号 序言 混合线性模型,又名多层线性模型(Hierarchical linear model)。它比较适合处理嵌套设计(nested)的实验和调查研究数据。此外,它还特别适合处理带有被试内变量的实验和调查数据,因 阅读全文
posted @ 2021-08-14 22:47 拓端tecdat 阅读(358) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23378 原文出处:拓端数据部落公众号 1 介绍 在本文中,我们将研究以下主题 证明为什么低维预测模型在高维中会失败。 进行主成分回归(PCR)。 使用glmnet()进行岭回归、lasso 和弹性网elastic net 对这些预测模型进行评估 阅读全文
posted @ 2021-08-14 22:46 拓端tecdat 阅读(309) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23322 原文出处:拓端数据部落公众号 月亮图和饼图 饼图把一个圆分成多个部分,这些部分的弧长(以及面积)代表一个整体的比例。月亮图也是如此,它把一个圆分成多个部分,这些部分的面积代表整个圆的比例,但在月亮图中,这些部分被画成圆的月牙形,就像月相。 阅读全文
posted @ 2021-08-14 22:44 拓端tecdat 阅读(171) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23344 原文出处:拓端数据部落公众号 在许多网站上都可以找到一个流行的德国信贷数据集german_credit,其中包含了银行贷款申请人的信息。该文件包含1000名申请人的20条信息。 下面的代码可以用来确定申请人是否有信用,以及他(或她)是否对 阅读全文
posted @ 2021-08-14 22:44 拓端tecdat 阅读(274) 评论(0) 推荐(0) 编辑
摘要:原文链接: http://tecdat.cn/?p=23312 原文出处:拓端数据部落公众号 引言 结构方程模型是一个线性模型框架,它对潜变量同时进行回归方程建模。 诸如线性回归、多元回归、路径分析、确认性因子分析和结构回归等模型都可以被认为是SEM的特例。在SEM中可能存在以下关系。 观察到的变量 阅读全文
posted @ 2021-08-10 12:00 拓端tecdat 阅读(416) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23305 原文出处:拓端数据部落公众号 在这篇文章中,我将展示如何使用R语言来进行支持向量回归SVR。 我们将首先做一个简单的线性回归,然后转向支持向量回归,这样你就可以看到两者在相同数据下的表现。 一个简单的数据集 首先,我们将使用这个简单的数据 阅读全文
posted @ 2021-08-07 10:13 拓端tecdat 阅读(528) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=9024 原文出处:拓端数据部落公众号 拓端tecdat:R语言广义相加模型(GAM)在电力负荷预测中的应用 视频:R语言广义相加模型(GAM)在电力负荷预测中的应用 1导言 这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要 阅读全文
posted @ 2021-08-07 10:11 拓端tecdat 阅读(227) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23287 原文出处:拓端数据部落公众号 引言 当从单变量波动率预测跳到多变量波动率预测时,我们需要明白,现在我们不仅要预测单变量波动率元素,还要预测协方差元素。假设你有两个序列,那么这个协方差元素就是2乘2方差-协方差矩阵的对角线。我们应该使用的准 阅读全文
posted @ 2021-08-05 23:59 拓端tecdat 阅读(169) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23276 原文出处:拓端数据部落公众号 有些问题是线性的,但有些问题是非线性的。我假设,你过去的知识是从讨论和解决线性问题开始的,这是一个自然的起点。对于非线性问题的解决,往往涉及一个初始处理步骤。这个初始步骤的目的是将问题转化为同样具有线性特征的 阅读全文
posted @ 2021-08-04 16:57 拓端tecdat 阅读(170) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23264 原文出处:拓端数据部落公众号 录取情况反映了公众对一所大学水平和实力的认知,是评价一所大学及其专业 "知名度 "的重要指标。 要点提示 本文对国内部分院校近两年的录取分数线进行分析,旨在为考生和家长在填报志愿时提供科学参考。 北京、上海、 阅读全文
posted @ 2021-08-04 16:53 拓端tecdat 阅读(45) 评论(0) 推荐(0) 编辑
摘要:原文链接 http://tecdat.cn/?p=23255 原文出处:拓端数据部落公众号 本文将谈论Stan以及如何在R中使用rstan创建Stan模型。尽管Stan提供了使用其编程语言的文档和带有例子的用户指南,但对于初学者来说,这可能是很难理解的。 Stan Stan是一种用于指定统计模型的编 阅读全文
posted @ 2021-08-04 16:52 拓端tecdat 阅读(302) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23250 原文出处:拓端数据部落公众号 回归数据可以用Keras深度学习API轻松拟合。在本教程中,我们将简要地学习如何通过使用R中的Keras神经网络模型来拟合和预测回归数据。在这里,我们将看到如何创建简单的回归数据,建立模型,训练它,并最终预测 阅读全文
posted @ 2021-08-04 16:50 拓端tecdat 阅读(308) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23242 原文出处:拓端数据部落公众号 简介 标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。观察到的病例是队列中病例的绝对数量。期望病例是通过将队列中的人-年数与参考人口比率相乘得出的。该比率应按混杂因素进行分层或调整。通常这 阅读全文
posted @ 2021-08-04 16:48 拓端tecdat 阅读(532) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23236 原文出处:拓端数据部落公众号 什么是频率学派? 在频率学派中,观察样本是随机的,而参数是固定的、未知的数量。 概率被解释为一个随机过程的许多观测的预期频率。 有一种想法是 "真实的",例如,在预测鱼的生活环境时,盐度和温度之间的相互作用有 阅读全文
posted @ 2021-08-04 16:44 拓端tecdat 阅读(445) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示