上一页 1 ··· 323 324 325 326 327 328 329 330 331 ··· 389 下一页
摘要: 原文 | http://tecdat.cn/?p=22336 来源 | 拓端数据部落公众号 Boosting算法是一种把若干个分类器整合为一个分类器的方法,也就是一种集成分类方法(Ensemble Method)。 计量经济学的视角 可以从计量经济学的角度理解提升方法(Boosting)的内容。这里 阅读全文
posted @ 2021-06-01 16:17 拓端tecdat 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22328 原文出处:拓端数据部落公众号 目前,回归诊断不仅用于一般线性模型的诊断,还被逐步推广应用于广义线性模型领域(如用于logistic回归模型),但由于一般线性模型与广义线性模型在残差分布的假定等方面有所不同,所以推广和应用还存在许多问题。鉴 阅读全文
posted @ 2021-06-01 16:15 拓端tecdat 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 原文 | http://tecdat.cn/?p=22319 来源 | 拓端数据部落公众号 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点和只使用所选变量的子集来 "清洗 "你的数据。 阅读全文
posted @ 2021-05-27 21:03 拓端tecdat 阅读(695) 评论(0) 推荐(0) 编辑
摘要: 原文链接: http://tecdat.cn/?p=22181 原文出处:拓端数据部落公众号 本文考虑一下基于核方法进行分类预测。注意,在这里,我们不使用标准逻辑回归,它是参数模型。 非参数方法 用于函数估计的非参数方法大致上有三种:核方法、局部多项式方法、样条方法。非参的函数估计的优点在于稳健,对 阅读全文
posted @ 2021-05-27 20:52 拓端tecdat 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22302 原文出处:拓端数据部落公众号 混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合。 混合效应逻辑回归的例子 例1:一个研究人员对40所不同大学的申请进行抽样调 阅读全文
posted @ 2021-05-27 20:51 拓端tecdat 阅读(398) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22273 动机 如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除。它有两个非常自然的用途,第一个是变量选择,第二个是预测。因为通常情况下,LASSO选择的变量会比普 阅读全文
posted @ 2021-05-27 20:40 拓端tecdat 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22226 原文出处:拓端数据部落公众号 两个随机变量之间的相依性问题备受关注,相依性(dependence)是反映两个随机变量之间关联程度的一个概念。它与相关性(correlation)有区别,常用的相关性度量是Pearson相关系数,它只度量了两 阅读全文
posted @ 2021-05-27 20:36 拓端tecdat 阅读(188) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22215 原文出处:拓端数据部落 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的。但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以使这些变量差分而平稳。这就是所谓的协整关系。由于知道这种关系可以改善分析的结果,所以希望有一个 阅读全文
posted @ 2021-05-27 20:32 拓端tecdat 阅读(370) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22206 模型背景 每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化。当对重复测量的标志变量进行建模时,我们通常不会把它看成是一个有误差测量的潜过程。然而,这正是混合模型理论所做的基本假设。潜过程混合模型利用这个框架 阅读全文
posted @ 2021-05-27 20:30 拓端tecdat 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=22160 这个例子展示了如何使用分位数随机林来检测异常值。分位数随机林可以检测到与给定X的Y的条件分布有关的异常值。 离群值是一些观测值,它的位置离数据集中的大多数其他观测值足够远,可以认为是异常的。离群观测的原因包括固有的变异性或测量误差。异常值 阅读全文
posted @ 2021-05-27 20:25 拓端tecdat 阅读(557) 评论(0) 推荐(0) 编辑
上一页 1 ··· 323 324 325 326 327 328 329 330 331 ··· 389 下一页