06 2023 档案
摘要:原文链接:http://tecdat.cn/?p=3897 最近我们被客户要求撰写关于主题建模LDA的研究报告,包括一些图形和统计输出。 文本分析:主题建模 library(tidyverse) theme_set( theme_bw()) 目标 定义主题建模 解释Latent Dirichlet以
阅读全文
摘要:原文链接:http://tecdat.cn/?p=4333 最近我们被客户要求撰写关于LDA模型的研究报告,包括一些图形和统计输出。 主题建模 在文本挖掘中,我们经常收集一些文档集合,例如博客文章或新闻文章,我们希望将其分成组,以便我们可以分别理解它们。主题建模是对这些文档进行无监督分类的一种方法,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26578 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于吉布斯采样器的研究报告,包括一些图形和统计输出。 指数分布是泊松过程中事件之间时间的概率分布,因此它用于预测到下一个事件的等待时间,例如,您需要在公共汽车站等待的时间,直到下一班车到
阅读全文
摘要:全文下载链接 http://tecdat.cn/?p=1951 最近我们被客户要求撰写关于共享单车的研究报告,包括一些图形和统计输出。 随着智能手机的普及和手机用户的激增,共享单车作为城市交通系统的一个重要组成部分,以绿色环保、便捷高效、经济环保为特征蓬勃发展 作为城市共享交通系统的一个重要组成部分
阅读全文
摘要:全文链接:https://tecdat.cn/?p=33031 原文出处:拓端数据部落公众号 分析师:Donglei Niu 判别分析(Discriminant analysis)是一种统计分析方法,旨在通过将一组对象(例如观察数据)分类到已知类别的组中,来发现不同组之间的差异。 什么是判别分析 判
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22160 最近我们被客户要求撰写关于分位数随机森林(QRF)回归树的研究报告,包括一些图形和统计输出。 这个例子展示了如何使用分位数随机林来检测异常值 分位数随机林可以检测到与给定X的Y的条件分布有关的异常值。 离群值是一些观测值,它的位置离数据集
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=22984 最近我们被客户要求撰写关于文本挖掘的研究报告,包括一些图形和统计输出。 一旦我们清理了我们的文本并进行了一些基本的词频分析,下一步就是了解文本中的观点或情感。这被认为是情感分析,本教程将引导你通过一个简单的方法来进行情感分析 。 简而
阅读全文
摘要:原文链接:http://tecdat.cn/?p=10278 最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。 生存分析(也称为工程中的可靠性分析)的目标是在协变量和事件时间之间建立联系 生存分析的名称源于临床研究,其中预测死亡时间,即生存,通常是主要目标。 视频:R语言生存分
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31162 最近我们被客户要求撰写关于SV模型的研究报告,包括一些图形和统计输出 本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。 模拟SV模型的估计方法: sim <- svsim(1000,mu=-9
阅读全文
摘要:全文链接:https://tecdat.cn/?p=33015 原文出处:拓端数据部落公众号 本文用逻辑回归和lasso算法医学上的疾病的相关因素,帮助客户确定哪种模型可用于某种疾病的相关因素分析。3个模型:Logistic模型、成组Lasso Logistic模型、由组Lasso选出协变量的Log
阅读全文
摘要:全文链接:http://tecdat.cn/?p=9766 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于动态可视化的研究报告,包括一些图形和统计输出。 在某些情况下,你可能希望通过在每帧中添加数据并保留先前添加的数据来进行动画处理。 现在,我们将通过制作点线图的动画来探索。 以下是制作图
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=11974 最近我们被客户要求撰写关于WinBUGS 的研究报告,包括一些图形和统计输出。 R2WinBUGS软件包提供了从R调用WinBUGS的便捷功能。它自动以WinBUGS可读的格式写入数据和脚本,以进行批处理(自1.4版开始)。WinBU
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26336 最近我们被客户要求撰写关于近似贝叶斯计算的研究报告,包括一些图形和统计输出。 近似贝叶斯计算和近似技术基于随机模拟模型中的样本计算近似似然值,在过去几年中引起了很多关注,因为它们有望为任何随机过程提供通用统计技术 一位同事向我询问我们在文
阅读全文
摘要:报告链接:https://tecdat.cn/?p=33011 原文出处:拓端数据部落公众号 发展新能源汽车成为各国共识。全球气候变暖和环境问题日益突出,越来越多的国家正加大推 进环境保护和低碳发展,目前已有超过130个国家和地区提出了实现“零碳”或“碳中和”的气 候目标。交通领域占全球二氧化碳排放
阅读全文
摘要:全文链接:https://tecdat.cn/?p=32998 原文出处:拓端数据部落公众号 本文首先介绍了IMDb(互联网电影资料库) TOP250及其排名算法、评分机制利弊,帮助客户通过分析《黑暗骑士》、《肖申克的救赎》和《教父》三部影片在2008年7月至9月评分数据,分析排名变动的原因。其次,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=19118 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 本文分析将用于制定管理客户和供应商关系的策略准则 假设: 贵公司拥有用于生产和分销聚戊二酸的设施,聚戊二酸是一种用于多个行业的化合物。 制造和分销过程的投入包括各种
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23652 最近我们被客户要求撰写关于贝叶斯回归的研究报告,包括一些图形和统计输出。 本文为读者提供了如何进行贝叶斯回归的基本教程。包括完成导入数据文件、探索汇总统计和回归分析 ( 点击文末“阅读原文”获取完整代码数据******** )。 在本文中
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=4612 最近我们被客户要求撰写关于贝叶斯简单线性回归的研究报告,包括一些图形和统计输出。 贝叶斯分析的许多介绍都使用了相对简单的教学实例(例如,根据伯努利数据给出成功概率的推理)。虽然这很好地介绍了贝叶斯原理,但是这些原则的扩展并不是直截了当的
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=9350 最近我们被客户要求撰写关于经济时间序列的研究报告,包括一些图形和统计输出。 经济时间序列的分析通常需要提取其周期性成分。这篇文章介绍了一些方法,可用于将时间序列分解为它们的不同部分 ( 点击文末“阅读原文”获取完整代码数据*******
阅读全文
摘要:全文链接:https://tecdat.cn/?p=32981 原文出处:拓端数据部落公众号 气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的
阅读全文
摘要:原文链接:http://tecdat.cn/?p=12486 最近我们被客户要求撰写关于VMD的研究报告,包括一些图形和统计输出。 创建一个以4 kHz采样的信号,类似于拨打数字电话的所有键 拨号音信号的变模分解 将信号另存为MATLAB®时间数据。 fs = 4e3; t = 0:1/fs:0.5
阅读全文
摘要:们被客户要求撰写关于文本挖掘的研究报告,包括一些图形和统计输出。 NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。我们可以使用这些数据集的元数据来理解它们之间的联系 1 NASA如何组织数据 首先,让我们下载JSON文件,并查看元
阅读全文
摘要:使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化,特别是_最小_最_大凹_度_惩罚_函数_(MCP)_和光滑切片绝对偏差惩罚(SCAD),以及其他L2惩罚的选项( “弹性网络”) 还提供了用于执行交叉验证以及拟合后可视化,摘要,推断和预测的实用程序。 我们研究 前列腺数据,它具有
阅读全文
摘要:被客户要求撰写关于灰色模型的研究报告,包括一些图形和统计输出。 以苏州商品房房价为研究对象,帮助客户建立了灰色预测模型 GM (1,1)、 BP神经网络房价预测模型,利用R语言分别实现了 GM (1,1)和 BP神经网络房价预测可视化 由于房价的长期波动性及预测的复杂性,利用传统的方法很难准确预测房
阅读全文
摘要:全文链接:https://tecdat.cn/?p=32968 原文出处:拓端数据部落公众号 分析师:Wenyi Shen 校园的温情关怀是智慧校园的一项重要内容。通过大数据与数据挖掘技术对学生日常校园内的消费信息进行快速筛选和比对,建立大数据模型,对校园内需要帮助的同学进行精准识别,为高校温情关怀
阅读全文
摘要:原文链接:http://tecdat.cn/?p=1078 最近我们被客户要求撰写关于文本分析LDA主题模型的研究报告,包括一些图形和统计输出。 618购物狂欢节前后,网民较常搜索的关键词在微博、微信、新闻三大渠道的互联网数据表现,同时通过分析平台采集618相关媒体报道和消费者提及数据 社交媒体指数
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32044 近年来,我国的跨境电子商务发展迅速,在过去五年中,其贸易额增长率达到了16.2%,已经成为稳定对外贸易的一支重要力量 一方面,随着跨境电子商务的发展,跨境电子商务的监管政策得到了进一步的改善,跨境电子商务的规模也得到了进一步的扩大,整个电
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=14997 最近我们被客户要求撰写关于主题模型(LDA)的研究报告,包括一些图形和统计输出。 在文本挖掘中,我们经常有文档集合,例如博客文章或新闻文章,我们希望将它们分成自然组,以便我们理解它们 主题建模是一种对此类文档进行分类的方法。在本视频中
阅读全文
摘要:原文链接:http://tecdat.cn/?p=20953 最近我们被客户要求撰写关于分布滞后线性和非线性模型的研究报告,包括一些图形和统计输出。 本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。Gasparrini等人[2010]和Gasparrini[2011]
阅读全文
摘要:全文链接:https://tecdat.cn/?p=32955 原文出处:拓端数据部落公众号 本文就将采用K-means算法和层次聚类对基于用户特征的微博数据帮助客户进行聚类分析。首先对聚类分析作系统介绍。其次对聚类算法进行文献回顾,对其概况、基本思想、算法进行详细介绍,再是通过一个仿真实验具体来强
阅读全文
摘要:原文链接:http://tecdat.cn/32858-2 作为数据人,我们渴望结识志同道合的伙伴!但忙碌的生活让我们错过了交流的机会。让时间慢下来,深入了解彼此,收获更多美好的想象。用热情和智慧点燃城市的火花,打造属于我们的数据圈子。期待与你相遇,开启难忘的数据之旅! 为什么要加入数据人同城交友群
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32044 近年来,我国的跨境电子商务发展迅速,在过去五年中,其贸易额增长率达到了16.2%,已经成为稳定对外贸易的一支重要力量(查看文末了解报告PDF版本免费获取方式)。 一方面,随着跨境电子商务的发展,跨境电子商务的监管政策得到了进一步的改善,跨
阅读全文
摘要:全文链接:http://tecdat.cn/?p=17884 最近我们被客户要求撰写关于BUGS/JAGS贝叶斯分析的研究报告,包括一些图形和统计输出。 在许多情况下,我们没有足够的计算能力评估空间中所有n维像素的后验概率 。在这些情况下,我们倾向于利用称为Markov-Chain Monte Ca
阅读全文
摘要:原文链接:http://tecdat.cn/?p=12350 最近我们被客户要求撰写关于空间可视化的研究报告,包括一些图形和统计输出。 在本文中,我使用ggmap可视化纽约市的交通事故 数据来自纽约市开放数据。我的数据范围是2012年至2015年。该数据跟踪车辆的类型,发生事故的街道的名称以及事故的
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=23848 最近我们被客户要求撰写关于决策树的研究报告,包括一些图形和统计输出。 在本文中,决策树是对例子进行分类的一种简单表示。它是一种有监督的机器学习技术,数据根据某个参数被连续分割。决策树分析可以帮助解决分类和回归问题 决策树算法将数据集分
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32840 原文出处:拓端数据部落公众号 随着经济的快速发展和城市化进程的不断推进,土地资源的利用和管理成为了一项极为重要的任务。而对于全国各省市而言,如何合理利用土地资源,通过科学的方法进行规划和管理,是提高土地利用效率的关键。 本文旨在应用SPS
阅读全文
摘要:值网格上计算套索LASSO或弹性网路惩罚的正则化路径 正则化(regularization) 该算法速度快,可以利用输入矩阵x中的稀疏性,拟合线性、logistic和多项式、poisson和Cox回归模型。可以通过拟合模型进行各种预测。它还可以拟合多元线性回归。” 例子 加载数据 这里加载了一个高斯
阅读全文
摘要:关于GARCH的研究报告,包括一些图形和统计输出。 本文分析将用于制定管理客户和供应商关系的策略准则 假设: 贵公司拥有用于生产和分销聚戊二酸的设施,聚戊二酸是一种用于多个行业的化合物。 制造和分销过程的投入包括各种石油产品和天然气。价格波动可能非常不稳定。 营运资金管理一直是一个挑战,最近汇率的走
阅读全文
摘要:全文链接:http://tecdat.cn/?p=24753 最近我们被客户要求撰写关于风险价值的研究报告,包括一些图形和统计输出。 在这项工作中,我通过创建一个包含四只基金的模型来探索 copula,这些基金跟踪股票、债券、美元和商品的市场指数 摘要 然后,我使用该模型生成模拟值,并使用实际收益和
阅读全文
摘要:报告链接:http://tecdat.cn/?p=32837 原文出处:拓端数据部落公众号 在国内,B2B内容营销人才十分稀缺,尤其是当内容营销人才从媒体型向营销型转变时,内容营销的价值得以量化,进一步加强了内容营销人才对自身价值的认识。 优秀的内容人才,尤其是那些能够制定营销策略、塑造观点的人才,
阅读全文
摘要:分析师:Yujia Shen 影响股票收益的因子一直是研究者与投资者关注的问题。虽然已有超过1000个因子被提出与确认,但它们的长期影响力及如何导致收益变化并未被研究透彻。本项目选择研究ROE在长期对股票收益的作用。 研究理念: 根据ROE大小将所有股票分成10组并在每个时段进行重组,一共追踪10年
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=22206 最近我们被客户要求撰写关于潜类别混合效应模型(LCMM)的研究报告,包括一些图形和统计输出。 每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化。 模型背景 当对重复测量的标志变量进行建模时,我们通常不会
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22458 最近我们被客户要求撰写关于动态模型平均的研究报告,包括一些图形和统计输出。 本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进
阅读全文
摘要:原文链接:http://tecdat.cn/?p=6095 最近我们被客户要求撰写关于生存分析与Cox回归的研究报告,包括一些图形和统计输出。 本文演示了如何在生存分析与Cox回归中计算IDI,NRI指标 读取样本数据 D=D[!is.na(apply(D,1,mean)),] ; dim(D) #
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30401 最近我们被客户要求撰写关于CPV模型的研究报告,包括一些图形和统计输出。 本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。我们被客户要求撰写关于CPV模型的研究报告 结果表明, 该模型在度量和预测房地产信贷违约率方面具有较好的
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32818 原文出处:拓端数据部落公众号 股票市场波动性模型一直是金融领域研究的热点之一。传统的波动性模型往往只考虑了静态条件下的波动性和相关性,难以准确捕捉市场的复杂性和多样性。 因此,本文提出了一种基于R语言改进的DCC-MGARCH模型,帮助客
阅读全文
摘要:library(keras) 生成样本数据集 首先,本教程的样本回归时间序列数据集。 plot( c ) points( a ) points( b ) points( y ) 点击标题查阅往期内容 RNN循环神经网络 、LSTM长短期记忆网络实现时间序列长期利率预测 左右滑动查看更多 01 02
阅读全文
摘要:原文链接:http://tecdat.cn/?p=25860 最近我们被客户要求撰写关于股票尾部相关性的研究报告,包括一些图形和统计输出。 什么是尾部相关性? 假设市场出现了属于最差 5% 的日子的回撤(缩减):有人可以问,鉴于市场处于蓝色区域,特定股票下跌的概率是多少? 我们都了解股票相对于市场的
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24480 最近我们被客户要求撰写关于风险价值的研究报告,包括一些图形和统计输出。 此示例说明如何使用三种方法估计风险价值 (VaR) 并执行 VaR 回测分析。这三种方法是: 正态分布 历史模拟 指数加权移动平均线 (EWMA) 风险价值是一种量化
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22273 最近我们被客户要求撰写关于LASSO的研究报告,包括一些图形和统计输出。 如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除 动机 它有两个非常自然的用途,
阅读全文
摘要:报告链接:http://tecdat.cn/?p=32811 原文出处:拓端数据部落公众号 本报告重点研究手术机器人在微创手术领域的应用。手术机器人是一种医疗服务机器人,能够辅助医生对医疗器械进行精准控制。它在泌尿科、妇科、普外科、骨科等临床手术中的应用不断扩大,并引起了各方的关注。 2020年,全
阅读全文
摘要:以苏州商品房房价为研究对象,帮助客户建立了灰色预测模型 GM (1,1)、 BP神经网络房价预测模型,利用R语言分别实现了 GM (1,1)和 BP神经网络房价预测可视化 由于房价的长期波动性及预测的复杂性,利用传统的方法很难准确预测房价,而灰色模型 GM (1,1)和神经网络的结合在一定程度上可以
阅读全文
摘要:撰写关于ARIMA-GARCH的研究报告,包括一些图形和统计输出。 在本文中,我们将尝试为苹果公司的日收益率寻找一个合适的 GARCH 模型 波动率建模需要两个主要步骤。 指定一个均值方程(例如 ARMA,AR,MA,ARIMA 等)。 建立一个波动率方程(例如 GARCH, ARCH,这些方程是由
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=29581 最近我们被客户要求撰写关于模拟股票价格的研究报告,包括一些图形和统计输出。 在本工作表中,我们将研究价格、收益率和波动性。波动性通常用收益率的均方差来衡量,例如夏普比率的分母,它被用作风险的衡量标准。 我们将使用股票价格的平均对数收益
阅读全文
摘要:原文链接:http://tecdat.cn/?p=11664 最近我们被客户要求撰写关于贝叶斯回归的研究报告,包括一些图形和统计输出。 我想研究如何使用pymc3在贝叶斯框架内进行线性回归。根据从数据中学到的知识进行推断 贝叶斯规则是什么? 本质上,我们必须将已经知道的知识与世界上的事实相结合。 这
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32794 原文出处:拓端数据部落公众号 近年来电子商务发展迅速,随之而来的信用问题给消费者带来诸多困扰,造成电子商务网上各种交易问题产生的原因是多方面的,但总的来说是缺乏有效的信用评价体系。目前各电子商务网站虽然都建立了信用评价体系,但是各网站提出
阅读全文
摘要:报告链接:http://tecdat.cn/?p=32805 原文出处:拓端数据部落公众号 全球疫情的爆发对于全球经济和消费市场都带来了很大的冲击,特别是在消费者的消费行为和零售市场格局方面发生了重大变革。同时由于全球供应链的重新调整,产业分化现象也加速出现。 中国跨境电商已经历了十年以上的发展,依
阅读全文
摘要:原文链接:http://tecdat.cn/?p=25158 最近我们被客户要求撰写关于lasso的研究报告,包括一些图形和统计输出。 本文介绍具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso
阅读全文
摘要:在本文中,我们将用R语言对数据进行线性混合效应模型的拟合,然后可视化你的结果 线性混合效应模型是在有随机效应时使用的,随机效应发生在对随机抽样的单位进行多次测量时。来自同一自然组的测量结果本身并不是独立的随机样本。因此,这些单位或群体被假定为从一个群体的 "人口 "中随机抽取的。示例情况包括 当你划
阅读全文
摘要:在 Tensorflow 之上运行的综合库,具有 CPU 和 GPU 功能 本文将演示如何在 R 中使用 LSTM 实现时间序列预测。 简单的介绍 时间序列涉及按时间顺序收集的数据。我用 xt∈R 表示单变量数据,其中 t∈T 是观察数据时的时间索引。时间 t 在 T=Z 的情况下可以是离散的,或者
阅读全文
摘要:全文链接:http://tecdat.cn/?p=19129 最近我们被客户要求撰写关于HAR和HEAVY模型的研究报告,包括一些图形和统计输出。 在本文中,在学术界和金融界,分析高频财务数据的经济价值现在显而易见。 摘要 它是每日风险监控和预测的基础,也是高频交易的基础。为了在财务决策中高效利用高
阅读全文
摘要:本文的研究目的是基于R语言的k-prototype算法,帮助客户对新能源汽车行业上市公司进行混合型数据集的聚类分析。 通过对公司的财务数据、市场表现和发展战略等多个方面的变量进行聚类分析,我们可以将这些公司划分为不同的类别,并分析不同类别的特点和发展趋势。 这样的研究结果对于投资者、政策制定者和行业
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=22984 最近我们被客户要求撰写关于文本挖掘的研究报告,包括一些图形和统计输出。 一旦我们清理了我们的文本并进行了一些基本的词频分析,下一步就是了解文本中的观点或情感。这被认为是情感分析,本教程将引导你通过一个简单的方法来进行情感分析 。 简而
阅读全文
摘要:全文链接:http://tecdat.cn/?p=2655 最近我们被客户要求撰写关于偏最小二乘回归(PLSR)和主成分回归(PCR)的研究报告,包括一些图形和统计输出。 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性 当存在大量预测变量
阅读全文
摘要:全文链接:http://tecdat.cn/?p=15929 最近我们被客户要求撰写关于风险价值的研究报告,包括一些图形和统计输出。 风险价值VaR和损失期望值ES是常见的风险度量 首先明确: 时间范围-我们展望多少天? 概率水平-我们怎么看尾部分布? 在给定时间范围内的盈亏预测分布,示例如图1所示
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=16708 最近我们被客户要求撰写关于随机波动率的研究报告,包括一些图形和统计输出。 波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR) 甚至波动率本身也是一种金
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32773 原文出处:拓端数据部落公众号 分析师:Feier Li ARIMA是可以拟合时间序列数据的模型,根据自身的过去值(即自身的滞后和滞后的预测误差)“解释” 给定的时间序列,因此可以使用方程式预测未来价值。任何具有模式且不是随机白噪声的“非季
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22813 最近我们被客户要求撰写关于混合效应的研究报告,包括一些图形和统计输出。 本教程为读者提供了使用频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法 本教程使
阅读全文
摘要:客户要求撰写关于金融时间序列的研究报告,包括一些图形和统计输出。 本文将说明单变量和多变量金融时间序列的不同模型,特别是条件均值和条件协方差矩阵、波动率的模型 均值模型 本节探讨条件均值模型。 iid模型 我们从简单的iid模型开始。iid模型假定对数收益率xt为N维高斯时间序列: 均值和协方差矩阵
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31887 最近我们被客户要求撰写关于聚类的研究报告,包括一些图形和统计输出。 本文通过 SQL Server Analysis Services数据挖掘的分析模块,帮助客户对一个职业、地区、餐饮消费水平的数据挖掘,并用可视化分析图表显示数据 该结果
阅读全文
摘要:全文链接:http://tecdat.cn/?p=24376 最近我们被客户要求撰写关于主题建模的研究报告,包括一些图形和统计输出。 在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 介绍 我们遵循结构化的工作流程,基于潜在狄利克雷分配 (LDA) 算法构
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32760 原文出处:拓端数据部落公众号 航班延误是航空公司、旅客和机场管理方面都面临的一个重要问题。航班延误不仅会给旅客带来不便,还会对航空公司和机场的运营产生负面影响。因此,对航班延误的影响因素进行预测分析,对于航空公司、旅客和机场管理方面都具有
阅读全文
摘要:原文链接:http://tecdat.cn/?p=7275 最近我们被客户要求撰写关于聚类的研究报告,包括一些图形和统计输出。 确定数据集中最佳的簇数是分区聚类(例如k均值聚类)中的一个基本问题,它要求用户指定要生成的簇数k。 一个简单且流行的解决方案包括检查使用分层聚类生成的树状图,以查看其是否暗
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22546 最近我们被客户要求撰写关于随机波动率SV模型的研究报告,包括一些图形和统计输出。 什么是随机波动率?随机波动率 (SV) 是指资产价格的波动率是变化的而不是恒定的 “随机”一词意味着某些变量是随机确定的,无法精确预测。 在金融建模的背景下
阅读全文
摘要:原文链接:http://tecdat.cn/?p=17592 最近我们被客户要求撰写关于隐马尔可夫HMM模型的研究报告,包括一些图形和统计输出。 最近,我们使用隐马尔可夫模型开发了一种解决方案,并被要求解释这个方案 HMM用于建模数据序列,无论是从连续概率分布还是从离散概率分布得出的。它们与状态空间
阅读全文
摘要:全文链接:http://tecdat.cn/?p=27279 最近我们被客户要求撰写关于深度学习循环神经网络RNN的研究报告,包括一些图形和统计输出。 此示例说明如何使用长短期记忆 (LSTM) 网络预测时间序列 LSTM神经网络架构和原理及其在Python中的预测应用 LSTM 网络是一种循环神经
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32747 原文出处:拓端数据部落公众号 随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31973 最近我们被客户要求撰写关于无套利区间模型的研究报告,包括一些图形和统计输出。 股指期货的套利交易有助于股指期货实现其价格发现以及风险规避的功能,因此提高套利交易的效率,对于发挥股指期货在经济发展中的作用有着重要的意义 本文帮助客户对期货期
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22160 最近我们被客户要求撰写关于分位数随机森林(QRF)回归树的研究报告,包括一些图形和统计输出。 这个例子展示了如何使用分位数随机林来检测异常值 分位数随机林可以检测到与给定X的Y的条件分布有关的异常值。 离群值是一些观测值,它的位置离数据集
阅读全文
摘要:阅读全文:http://tecdat.cn/?p=10932 最近我们被客户要求撰写关于贝叶斯层次模型的研究报告,包括一些图形和统计输出。 在本文中,我将重点介绍使用集成嵌套 拉普拉斯近似方法的贝叶斯推理。可以估计贝叶斯 层次模型的后边缘分布。鉴于模型类型非常广泛,我们将重点关注用于分析晶格数据的空
阅读全文
摘要:报告链接:http://tecdat.cn/?p=32732 原文出处:拓端数据部落公众号 本白皮书对智慧城市的发展历程进行了归纳和总结,分析了发展实践中的新变化和新内涵,并提出了一系列新的智慧城市建设理念、架构和建议。 其目的在于为建设新型智慧城市提供参考,这种城市应该应用先进技术、产生良好社会效
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32715 原文出处:拓端数据部落公众号 分析师:Xiaoyang Zhou 本文以天气数据实时抓取和可视化展示为主题,旨在探讨如何使用Python编写程序来实现对天气数据的抓取、可视化和预测。 从中国气象局天气预报网来获取数据 首先,我们需要从中国
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23305 最近我们被客户要求撰写关于支持向量机回归的研究报告,包括一些图形和统计输出。 在这篇文章中,我将展示如何使用R语言来进行支持向量回归SVR 我们将首先做一个简单的线性回归,然后转向支持向量回归,这样你就可以看到两者在相同数据下的表现。 一
阅读全文
摘要:全文链接:http://tecdat.cn/?p=27279 最近我们被客户要求撰写关于深度学习循环神经网络RNN的研究报告,包括一些图形和统计输出。 此示例说明如何使用长短期记忆 (LSTM) 网络预测时间序列 LSTM神经网络架构和原理及其在Python中的预测应用 LSTM 网络是一种循环神经
阅读全文
摘要:原文链接:http://tecdat.cn/?p=20953 最近我们被客户要求撰写关于分布滞后线性和非线性模型的研究报告,包括一些图形和统计输出。 本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。Gasparrini等人[2010]和Gasparrini[2011]
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31733 最近我们被客户要求撰写关于Copula的研究报告,包括一些图形和统计输出。 Copula方法是测度金融市场间尾部相关性比较有效的方法,而且可用于研究非正态、非线性以及尾部非对称等较复杂的相依特征关系 因此,Copula方法开始逐渐代替多元
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32707 原文出处:拓端数据部落公众号 在金融市场中,债券的流动性风险一直是一个备受关注的问题。流动性风险是指在市场上,债券价格的波动程度受到市场流动性的影响,这种影响可能导致债券价格的剧烈波动,从而影响投资者的收益。因此,对于债券流动性风险的度量
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30680 最近我们被客户要求撰写关于电影市场调查问卷数据的研究报告,包括一些图形和统计输出。 这是一份有关消费者对电影市场看法及建议的调查报告,我们采取了问卷调查法,其中发放问卷256份,回收有效问卷200份 ( 点击文末“阅读原文”获取完整代码数
阅读全文
摘要:全文链接:http://tecdat.cn/?p=2655 最近我们被客户要求撰写关于偏最小二乘回归(PLSR)和主成分回归(PCR)的研究报告,包括一些图形和统计输出。 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性 当存在大量预测变量
阅读全文
摘要:图形和统计输出。 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化 有25个变量: ID: 每个客户的ID LIMIT_BAL: 金额 SEX: 性别(1 =男,2 =女)4.教育程度:(1 =研究生,2 =本科,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23689 最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。 本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测 ( 点击文末“阅读原文”获取完整代码数据******** )。 在本文中,你将看到
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32694 原文出处:拓端数据部落公众号 分析师:Li Yu 因子分析是指研究从变量群中提取隐藏的具有代表性共性因子的统计技术。进而起到降维的目的,还可检验变量间关系的假设。 最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32677 原文出处:拓端数据部落公众号 研究黄金价格的动态演变过程至关重要。文中以黄金交易市场下午定盘价格为基础,帮助客户利用时间序列的相关理论,建立了黄金价格的ARMA-GARCH模型,并对数据进行了实证分析,其结果非常接近。利用该模型可动态刻画
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=23848 最近我们被客户要求撰写关于决策树的研究报告,包括一些图形和统计输出。 在本文中,决策树是对例子进行分类的一种简单表示。它是一种有监督的机器学习技术,数据根据某个参数被连续分割。决策树分析可以帮助解决分类和回归问题 ( 点击文末“阅读原
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=2175 最近我们被客户要求撰写关于LDA主题模型的研究报告,包括一些图形和统计输出。 研究人员对各大电商平台海量用户的评价数据进行分析,得出智能门锁剁手攻略 语义透镜 顾客满意度和关注点 我们对于评价数据进行LDA建模,就是从语料库中挖掘出不同
阅读全文
摘要:全文链接:http://tecdat.cn/?p=5620 最近我们被客户要求撰写关于金融应用编程的研究报告,包括一些图形和统计输出。 在本文中随机过程对定量融资的许多方面都很有用,包括但不限于衍生品定价,风险管理和投资管理 这些应用程序将在本文后面进一步详细讨论。本节介绍了量化融资中使用的一些流行
阅读全文
摘要:原文链接:http://tecdat.cn/?p=19211 最近我们被客户要求撰写关于疫情数据的研究报告,包括一些图形和统计输出。 本文用matlab分析疫情数据集 数据源 我们检查解压缩的文件。包含: confirmed.csv-确诊病例的时间序列数据 deaths.csv-死亡人数的时间序列数
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24407 最近我们被客户要求撰写关于金融时间序列模型的研究报告,包括一些图形和统计输出。 这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用 ( 点击文末“阅读原文”获取完整代码
阅读全文
摘要:全文链接:http://tecdat.cn/?p=2655 最近我们被客户要求撰写关于偏最小二乘回归的研究报告,包括一些图形和统计输出。 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性 ( 点击文末“阅读原文”获取完整代码数据******
阅读全文
摘要:全文链接:http://tecdat.cn/?p=2155 最近我们被客户要求撰写关于NLP自然语言处理的研究报告,包括一些图形和统计输出。 随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的时代
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31023 最近我们被客户要求撰写关于GARCH族模型的研究报告,包括一些图形和统计输出。 如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题 ( 点击文末“阅读原文”获取完整代码数据******** )。 VaR方法作为当
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32660 原文出处:拓端数据部落公众号 肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战。现代医学治疗肿瘤的手段和方
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22721 最近我们被客户要求撰写关于Lasso回归的研究报告,包括一些图形和统计输出。 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择 ( 点击文末“阅
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22458 最近我们被客户要求撰写关于动态模型平均的研究报告,包括一些图形和统计输出。 本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=23681 最近我们被客户要求撰写关于线性混合效应的研究报告,包括一些图形和统计输出。 线性混合效应模型与我们已经知道的线性模型有什么不同 ( 点击文末“阅读原文”获取完整代码数据******** ) ? 线性混合模型(有时被称为 "多层次模型
阅读全文
摘要:报告链接:http://tecdat.cn/?p=32654 原文出处:拓端数据部落公众号 在这一特别的环境下,我国的母婴消费市场将会发生什么新的变化?面对这一代又一代交替的母亲与母亲,他们的消费观念与养育模式又有什麽新的标记?面对怎样的新挑战,新的机会?报告从母婴行业现状与趋势、母婴人群精准画像、
阅读全文
摘要:全文链接:http://tecdat.cn/?p=32646 原文出处:拓端数据部落公众号 分析师:Junjun Li 在这篇文章中,我们将着重探讨高维数据下的机器学习应用,以房屋市场租金价格预测为例。在实际生活中,房屋租金作为一个重要的经济指标,被广泛应用于城市规划、财务投资等方面的决策中。然而,
阅读全文