摘要:
原文链接:http://tecdat.cn/?p=19077 导入 自组织映射 (SOM)是一种工具,通过生成二维表示来可视化高维数据中的模式,在高维结构中显示有意义的模式。通过以下方式使用给定的数据(或数据样本)对SOM进行“训练”: 定义了网格的大小。 网格中的每个单元都在数据空间中分配了一个初 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=19018 之前我们讨论了使用ROC曲线来描述分类器的优势,有人说它描述了“随机猜测类别的策略”,让我们回到ROC曲线来说明。考虑一个非常简单的数据集,其中包含10个观测值(不可线性分离) 在这里我们可以检查一下,确实是不可分离的 plot(x1,x 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=19006 最新研究表明,中国有超过7亿人在观看在线视频内容。Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个弹幕视频网站,最大的年轻人潮流文化娱乐社区,截至2020年3月31日的第一季度它已经拥有超过1.7亿的月度用户,反映了许多人认 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=18993 在回归模型研究中,我们将讨论优化,而经典工具就是所谓的共轭。给定函数f:Rp→R,其共轭值为函数f ⋆:Rp→R使得 可视化考虑一个简单的抛物线函数(在维度1中)f(x)= x ^ 2 / 2,然后f ⋆(2)是线x↦2x与函数f(x)之 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=18984 现在,分位数回归已被确立为重要的计量经济学工具。与均值回归(OLS)不同,目标不是给定x的均值,而是给定x的一些分位数。您可以使用它来查找具有良好上升潜力的股票。您可能会认为这与股票的beta有关,但是beta与OLS相关,并且是对称的。 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=18970 在普遍的理解中,最大似然估计是使用已知的样本结果信息来反向推断最有可能导致这些样本结果的模型参数值! 换句话说,最大似然估计提供了一种在给定观测数据的情况下评估模型参数的方法,即“模型已确定且参数未知”。 在所有双射函数的意义上,极大似然 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=18944 本文将使用一个小数据说明ROC曲线,其中n = 10个观测值,两个连续变量x_1和x_2,以及二元变量y∈{0,1}。 我们可以表示平面(x_1,x_2)中的点,并且对y∈{0,1}中的y 使用不同的颜色。 df = data.frame 阅读全文
摘要:
原文链接:http://tecdat.cn/?p=18927 本文使用波兰公寓价格数据说明Fisher检验。 with(data = apart , boxplot(price ~ dis )) 我们在这里对公寓进行分组(这也可以通过简单的回归,这里5个解释变量并不重要)。我们可以重新排列 A = 阅读全文