12 2021 档案
摘要:原文链接:http://tecdat.cn/?p=967 原文出处:拓端数据部落公众号 数据简介 对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率。 对于付费用户预测,主要是思考收入由哪些因素推动,再对每个因素做预测,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24141 原文出处:拓端数据部落公众号 数据简介 社会经济因素如何影响收入和工资,收入是否存在性别歧视,高等教育对提高工资收入是否有好处? 工人收入工资及其社会经济影响因素数据包含了935名样本的收入、教育、几个人口统计学变量和智商分数的信息,可用
阅读全文
摘要:原文出处:拓端数据部落公众号 “ 哪种营销活动最成功?这家公司的普通客户是什么样的?营销活动没有预期的那么有效,如何分析数据了解此问题并提出数据驱动的解决方案? ” 要点提示 在竞争非常激烈的市场中,公司必须优化其潜在的可寻市场 (PAM)。使用市场细分,好处是更少花费资源(时间和金钱)。让公司通过
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22898 原文出处:拓端数据部落公众号 随着社会经济的发展,饮食生活已经逐渐融入了我们的日常生活世界,每天都不可避免地在 "吃 "的问题上有更多的考虑,吃好、吃多已经不再是我们的烦恼。 要点提示 外卖的盛行已经成为各地的普遍现象,越来越多的大学生喜
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24492 原文出处:拓端数据部落公众号 介绍 此分析的目的是构建一个过程,以在给定时变波动性的情况下正确估计风险价值。风险价值被广泛用于衡量金融机构的市场风险。我们的时间序列数据包括 1258 天的股票收益。为了解释每日收益率方差的一小部分,我们使
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24480 原文出处:拓端数据部落公众号 此示例说明如何使用三种方法估计风险价值 (VaR) 并执行 VaR 回测分析。这三种方法是: 正态分布 历史模拟 指数加权移动平均线 (EWMA) 风险价值是一种量化与投资组合相关的风险水平的统计方法。VaR
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24456 原文出处:拓端数据部落公众号 如果你正在进行统计分析:想要加一些先验信息,最终你想要的是预测。所以你决定使用贝叶斯。但是,你没有共轭先验。你可能会花费很长时间编写 Metropolis-Hastings 代码,优化接受率和提议分布,或者你
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24441 原文出处:拓端数据部落公众号 我们研究波动聚集,以及使用单变量 GARCH(1,1) 模型对其进行建模。 波动聚集 波动聚集——存在相对平稳时期和高波动时期的现象——是市场数据的一个看似普遍的属性。对此没有普遍接受的解释。GARCH(广义
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24431 原文出处:拓端数据部落公众号 配置神经网络很困难,因为没有关于如何去做的好的理论。 您必须系统地从动态和客观结果的角度探索不同的参数配置,以尝试了解给定预测建模问题的情况。 在本教程中,您将了解如何探索如何针对时间序列预测问题配置 LST
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24421 原文出处:拓端数据部落公众号 AdaBoost是? Boosting指的是机器学习元算法系列,它将许多 "弱 "分类器的输出合并成一个强大的 "集合",其中每个弱分类器单独的错误率可能只比随机猜测好一点。 AdaBoost这个名字代表了自
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24407 原文出处:拓端数据部落公众号 这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用。 介绍 一个 ARMA (AutoRegressive-Moving Average)
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24376 原文出处:拓端数据部落公众号 在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 。 介绍 我们遵循结构化的工作流程,基于潜在狄利克雷分配 (LDA) 算法构建了一个主题模型。 在这篇文章中,我们
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24386 原文出处:拓端数据部落公众号 本文演示了训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。由于本教程使用 Keras Sequential API,因此创建和训练我们的模型只需几行代码。 设置 library(k
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24354 原文出处:拓端数据部落公众号 本文介绍简化模型构建和评估过程。 caret包的train 函数可用于 使用重采样评估模型调整参数对性能的影响 在这些参数中选择“最佳”模型 从训练集估计模型性能 首先,必须选择特定的模型。 调整模型的第一步
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24365 原文出处:拓端数据部落公众号 描述 var对象指定了p阶平稳的多变量向量自回归模型(VAR(p))模型的函数形式并存储了参数值。 varm 对象的关键组成部分 包括时间序列的数量和多元自回归多项式 ( p )的阶数,因为它们完全指定了模型
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24334 原文出处:拓端数据部落公众号 1. 了解 Stan 像任何统计建模一样,贝叶斯建模可能需要为你的研究问题设计合适的模型,然后开发该模型,使其符合你的数据假设并运行。 统计模型可以在R或其他统计语言的各种包中进行拟合。但有时你在概念上可以设
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24346 原文出处:拓端数据部落公众号 1.1 项目背景: 在今天产品高度同质化的品牌营销阶段,企业与企业之间的竞争集中地体现在对客户的争夺上。“用户就是上帝”促使众多的企业不惜代价去争夺尽可能多的客户。但是企业在不惜代价发展新用户的过程中,往往会
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24231 原文出处:拓端数据部落公众号 Boosting 是一类集成机器学习算法,涉及结合许多弱学习器的预测。 弱学习器是一个非常简单的模型,尽管在数据集上有一些技巧。在开发实用算法之前很久,Boosting 就是一个理论概念,而 AdaBoost
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24211 原文出处:拓端数据部落公众号 描述 使用 garch 指定一个单变量GARCH(广义自回归条件异方差)模型。 garch 模型的关键参数包括: GARCH 多项式,由滞后条件方差组成。阶数用P表示 。 ARCH多项式,由滞后平方组成。阶数
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24203 原文出处:拓端数据部落公众号 本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型) 。 当前教程特别关注贝叶斯逻辑回归在二元结果和计数/比例结果场景中的使用,以及模型评估的相应方法。使用教育数据示例。 此外,本教程简要演示了贝
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24198 原文出处:拓端数据部落公众号 简介 《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境。在本项目中,我将使用世界幸福报告中的数据来探索
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24191 原文出处:拓端数据部落公众号 在这篇文章中,我将集中讨论一个给定一个短数据序列的推断概率的例子。我将首先介绍如何用贝叶斯方法进行期望推理的理论,然后在 Python 中实现该理论,以便我们能够处理这些想法。为了使文章更容易理解,我将只考虑
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24182 原文出处:拓端数据部落公众号 概要 本文用 R 编程语言极值理论 (EVT) 以确定 10 只股票指数的风险价值(和条件 VaR)。使用 Anderson-Darling 检验对 10 只股票的组合数据进行正态性检验,并使用 Block
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24162 原文出处:拓端数据部落公众号 在这个例子中,我们考虑马尔可夫转换随机波动率模型。 统计模型 设 yt为因变量,xt 为 yt 未观察到的对数波动率。对于 t≤tmax,随机波动率模型定义如下 状态变量 ct 遵循具有转移概率的二状态马尔可
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24172 原文出处:拓端数据部落公众号 背景和定义 每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。有时,这个潜过程是通过几个标志来衡量的,因此潜过程是它们的共同因素。 多元标记的潜过程混合模型 Proust-Li
阅读全文