05 2023 档案

摘要:原文链接:http://tecdat.cn/?p=22665 最近我们被客户要求撰写关于状态空间模型的研究报告,包括一些图形和统计输出。 状态空间建模是一种高效、灵活的方法,用于对大量的时间序列和其他数据进行统计推断 摘要 本文介绍了状态空间建模,其观测值来自指数族,即高斯、泊松、二项、负二项和伽马 阅读全文
posted @ 2023-05-31 23:22 拓端tecdat 阅读(38) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=6811 最近我们被客户要求撰写关于粒子群优化的研究报告,包括一些图形和统计输出。 粒子群优化(PSO) 在PSO中,群中的每个粒子表示为向量。在投资组合优化的背景下,这是一个权重向量,表示每个资产的分配资本。矢量转换为多维搜索空间中的位置。每个粒子 阅读全文
posted @ 2023-05-31 23:20 拓端tecdat 阅读(81) 评论(0) 推荐(0) 编辑
摘要:原文链接: http://tecdat.cn/?p=25939 最近我们被客户要求撰写关于多输出(多因变量)回归的研究报告,包括一些图形和统计输出。 在之前的文章中,我们研究了许多使用 多输出回归分析的方法。在本教程中,我们将学习如何使用梯度提升决策树GRADIENT BOOSTING REGRES 阅读全文
posted @ 2023-05-31 23:18 拓端tecdat 阅读(178) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30832 最近我们被客户要求撰写关于K-Means(K-均值)聚类算法的研究报告,包括一些图形和统计输出。 本文首先阐明了聚类算法的基本概念,介绍了几种比较典型的聚类算法,然后重点阐述了K-均值算法的基本思想,对K-均值算法的优缺点做了分析,回顾了 阅读全文
posted @ 2023-05-31 23:16 拓端tecdat 阅读(40) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32633 原文出处:拓端数据部落公众号 物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。 阅读全文
posted @ 2023-05-31 23:15 拓端tecdat 阅读(159) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=26271 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路,分别由 Engle (1982) 和 Bollersl 阅读全文
posted @ 2023-05-30 22:55 拓端tecdat 阅读(31) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22862 最近我们被客户要求撰写关于风险价值的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度 什么是风险价值(VaR)? 该指标最常被投资银行和商业银行用来确定 阅读全文
posted @ 2023-05-30 22:54 拓端tecdat 阅读(40) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=26184 最近我们被客户要求撰写关于信贷风控模型的研究报告,包括一些图形和统计输出。 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化? 有25个变量: ID:  阅读全文
posted @ 2023-05-30 22:51 拓端tecdat 阅读(15) 评论(0) 推荐(0) 编辑
摘要:全文下载:http://tecdat.cn/?p=22319 最近我们被客户要求撰写关于偏最小二乘法(PLS)回归的研究报告,包括一些图形和统计输出。 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去 阅读全文
posted @ 2023-05-30 22:50 拓端tecdat 阅读(83) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32604 原文出处:拓端数据部落公众号 分析师:Bailey Zheng和Lijie Zhang 即使是同一种植物,由于生长的地理环境的不同,它们的特征会有所差异。例如鸢尾花,可分为山鸢尾、杂色鸢尾、维吉尼亚鸢尾。 假设此时您得到了一朵鸢尾花,如何 阅读全文
posted @ 2023-05-30 22:48 拓端tecdat 阅读(35) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22702 最近我们被客户要求撰写关于贝叶斯分位数回归的研究报告,包括一些图形和统计输出。 贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯 摘要 还包 阅读全文
posted @ 2023-05-29 22:45 拓端tecdat 阅读(17) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=10911 最近我们被客户要求撰写关于推荐系统的研究报告,包括一些图形和统计输出。 用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品 1. 用户和产品的潜在特征 我们可以通过为每个用户和每部电影分配属性,然后将它们相乘并合 阅读全文
posted @ 2023-05-29 22:43 拓端tecdat 阅读(112) 评论(0) 推荐(0) 编辑
摘要:报告链接:http://tecdat.cn/?p=31861 新能源汽车市场从政策推动到市场驱动的转变过程中,行业也在经过了一个萌芽期和初期的探索期之后,步入了一个迅速发展的时期。此外,在科技力量的加持下,品牌、车型、区域等细分领域都在持续地进行着调整,行业格局已经初具规模,在持续的创新中,产业已经 阅读全文
posted @ 2023-05-29 22:41 拓端tecdat 阅读(84) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=10278 最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。 生存分析(也称为工程中的可靠性分析)的目标是在协变量和事件时间之间建立联系 生存分析的名称源于临床研究,其中预测死亡时间,即生存,通常是主要目标。 视频:R语言生存分 阅读全文
posted @ 2023-05-29 22:40 拓端tecdat 阅读(15) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32594 原文出处:拓端数据部落公众号 在当今信息爆炸的时代,电影作为人们生活中不可或缺的娱乐方式,受到了越来越多的关注。而为了让观众能够更好地选择适合自己口味的电影,推荐系统成为了一个备受关注的研究领域。协同过滤算法是其中一种被广泛使用的方法。 阅读全文
posted @ 2023-05-29 22:38 拓端tecdat 阅读(96) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=31846 最近我们被客户要求撰写关于关联规则的研究报告,包括一些图形和统计输出。 本文帮助客户运用关联规则方法分析中医治疗脑出血方剂,用Apriori模型挖掘所选用的主要药物及其用药规律,为临床治疗脑出血提供参考 脑出血急性期用药数据 读取数据 a 阅读全文
posted @ 2023-05-27 21:17 拓端tecdat 阅读(21) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=27384 最近我们被客户要求撰写关于葡萄酒的研究报告,包括一些图形和统计输出。 在本文中,数据包含有关葡萄牙“Vinho Verde”葡萄酒的信息 介绍 该数据集(查看文末了解数据获取方式)有1599个观测值和12个变量,分别是固定酸度、挥发性酸度 阅读全文
posted @ 2023-05-27 21:16 拓端tecdat 阅读(66) 评论(0) 推荐(0) 编辑
摘要:从上图可以看出不同地区留言板的情感倾向分布,总的来说,负面情感留言数目和积极情感相差不多,负面情感留言较多,占比46%,积极情感留言占比42%,中立情感的留言占比11%。 从地区来看,活跃在各大媒体的“朝阳区群众”留言数目也是最多的,其次是海淀区,昌平区。因此,从情感分布来看大部分留言还是在反应存在 阅读全文
posted @ 2023-05-27 21:14 拓端tecdat 阅读(25) 评论(0) 推荐(0) 编辑
摘要:原文链接 http://tecdat.cn/?p=1130 最近我们被客户要求撰写关于时间序列预测的研究报告,包括一些图形和统计输出。 如今DT(数据技术)时代,数据变得越来越重要,其核心应用“预测”也成为互联网行业以及产业变革的重要力量。 对于零售行业来说,预测几乎是商业智能(BI)研究的终极问题 阅读全文
posted @ 2023-05-27 21:11 拓端tecdat 阅读(68) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32574 原文出处:拓端数据部落公众号 近日,拓端获得了腾讯云开发者社区的“2022年度优秀作者”称号。 自入驻腾讯云开发者社区以来,我们共发布了980篇文章,内容涵盖数据资讯、行业动态、技术发展趋势等。同时,我们也一直在扎实生产内容,不断更新内容 阅读全文
posted @ 2023-05-27 21:09 拓端tecdat 阅读(21) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=11161 最近我们被客户要求撰写关于贝叶斯模型的研究报告,包括一些图形和统计输出。 概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用 R语言中RStan贝叶斯层次模型分析示例 stan简介 Stan是用 阅读全文
posted @ 2023-05-24 22:14 拓端tecdat 阅读(114) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=26147 最近我们被客户要求撰写关于多项式曲线回归的研究报告,包括一些图形和统计输出。 本文使用的数据集记录了 1236 名新生婴儿的体重(查看文末了解数据获取方式),以及他们母亲的其他协变量 本研究的目的是测量吸烟对新生儿体重的影响。研究人员需要 阅读全文
posted @ 2023-05-24 22:13 拓端tecdat 阅读(21) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=19664 最近我们被客户要求撰写关于Metropolis-Hastings采样的研究报告,包括一些图形和统计输出。 MCMC是从复杂概率模型中采样的通用技术。 蒙特卡洛 马尔可夫链 Metropolis-Hastings算法 问题 如果需要计算有复 阅读全文
posted @ 2023-05-24 22:11 拓端tecdat 阅读(42) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23115 最近我们被客户要求撰写关于copula GARCH的研究报告,包括一些图形和统计输出。 在这个文章中,我们演示了copula GARCH方法(一般情况下) 1 模拟数据 首先,我们模拟一下创新分布。我们选择了一个小的样本量。理想情况下,样 阅读全文
posted @ 2023-05-24 22:10 拓端tecdat 阅读(60) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32540 原文出处:拓端数据部落公众号 聚类分析是一种常见的数据挖掘方法,已经广泛地应用在模式识别、图像处理分析、地理研究以及市场需求分析。本文主要研究聚类分析算法K-means在电商评论数据中的应用,挖掘出虚假的评论数据。 本文主要帮助客户研究聚 阅读全文
posted @ 2023-05-24 22:08 拓端tecdat 阅读(44) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=6962 最近我们被客户要求撰写关于马尔可夫转换模型的研究报告,包括一些图形和统计输出。 假设 有时间序列数据,如下所示。经验表明,目标变量y似乎与解释变量x有关。然而,乍一看,y在水平中间波动,所以它似乎并不总是有稳定的关系(背后有多个状态) 上面 阅读全文
posted @ 2023-05-23 23:29 拓端tecdat 阅读(98) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=14593 最近我们被客户要求撰写关于SIR模型的研究报告,包括一些图形和统计输出。 与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。这里介绍一个使用R模拟网络扩散的例子 基本的算法非常简单:生成一个网络:g(V, E)。随机选择一 阅读全文
posted @ 2023-05-23 23:28 拓端tecdat 阅读(150) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22721 最近我们被客户要求撰写关于Lasso回归模型的研究报告,包括一些图形和统计输出。 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择 根据惩罚项的 阅读全文
posted @ 2023-05-23 23:26 拓端tecdat 阅读(61) 评论(0) 推荐(0) 编辑
摘要:阅读全文:http://tecdat.cn/?p=17375 最近我们被客户要求撰写关于马尔可夫链的研究报告,包括一些图形和统计输出。 为了帮助客户使用POT模型,本指南包含有关使用此模型的实用示例。本文快速介绍了极值理论(EVT)、一些基本示例,最后则通过案例对河流的极值进行了具体的统计分析 EV 阅读全文
posted @ 2023-05-23 23:24 拓端tecdat 阅读(63) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32520 原文出处:拓端数据部落公众号 通常在现实应用中,我们需要去理解一个变量是如何被一些其他变量所决定的。 回答这样的问题,需要我们去建立一个模型。一个模型就是一个公式之中,一个因变量(dependent variable)(需要预测的值)会随 阅读全文
posted @ 2023-05-23 23:23 拓端tecdat 阅读(61) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2784 最近我们被客户要求撰写关于决策树神经网络的研究报告,包括一些图形和统计输出。 之前在某社区中看到一篇帖子《一张价值几十万个跌停的统计表》,主要是预测即将被ST的股票,虽然有些标题党,但是还有有一些参考价值的 文章中使用了净利润指标来对可能成 阅读全文
posted @ 2023-05-22 22:43 拓端tecdat 阅读(47) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2657 最近我们被客户要求撰写关于ARMA-GARCH的研究报告,包括一些图形和统计输出。 本文展示了如何基于基础ARMA-GARCH过程(当然这也涉及广义上的QRM)来拟合和预测风险价值(Value-at-Risk,VaR) library(qr 阅读全文
posted @ 2023-05-22 22:42 拓端tecdat 阅读(56) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32511 原文出处:拓端数据部落公众号 时间序列模型的理论已经非常丰富,模型的应用也相当广泛。但现实生活中,越来越多的时间序列模型呈现出了非线性的特点,因此,研究非线性时间序列模型的理论及对其参数进行估计有着极其重要的意义。门限模型作为非线性时间序 阅读全文
posted @ 2023-05-22 22:41 拓端tecdat 阅读(63) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22458 最近我们被客户要求撰写关于动态模型平均的研究报告,包括一些图形和统计输出。 本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进 阅读全文
posted @ 2023-05-22 22:39 拓端tecdat 阅读(49) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30426 最近我们被客户要求撰写关于GARCH-EVT-Copula的研究报告,包括一些图形和统计输出。 对VaR计算方法的改进,以更好的度量开放式基金的风险。本项目把基金所持股票看成是一个投资组合,引入Copula来描述多只股票间的非线性相关性, 阅读全文
posted @ 2023-05-22 22:37 拓端tecdat 阅读(77) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=24141 最近我们被客户要求撰写关于贝叶斯的研究报告,包括一些图形和统计输出。 在本文中,贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。对社会经济因素如何影响收入和工资的研究为应用这些技术提供了充分的机会,同时也为从性别歧视到高等教育的好处等 阅读全文
posted @ 2023-05-19 21:32 拓端tecdat 阅读(54) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=26184 最近我们被客户要求撰写关于信贷风控模型的研究报告,包括一些图形和统计输出。 在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?以及不同人口统计学变量的类别,拖欠还款的概率如何变化? 有25个变量: ID:  阅读全文
posted @ 2023-05-19 21:29 拓端tecdat 阅读(69) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6095 最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。 本文演示了如何在生存分析与Cox回归中计算IDI,NRI指标 读取样本数据 D=D[!is.na(apply(D,1,mean)),] ; dim(D) ## [1]  阅读全文
posted @ 2023-05-19 21:28 拓端tecdat 阅读(95) 评论(0) 推荐(0) 编辑
摘要:报告链接:http://tecdat.cn/?p=32503 原文出处:拓端数据部落公众号 最近几年,对那些致力于全球化的公司而言,国际市场上充斥着更多的不确定性与挑战。新冠疫情对全球供应链的直接冲击,再加上日益加剧的地缘政治因素,导致全球全球化进程减缓,国际贸易与外资在一定程度上受到了影响。中国面 阅读全文
posted @ 2023-05-19 21:26 拓端tecdat 阅读(99) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32496 原文出处:拓端数据部落公众号 人口流动与迁移,作为人类产生以来就存在的一种社会现象,伴随着人类文明的不断进步从未间断。 人力资源是社会文明进步、人民富裕幸福、国家繁荣昌盛的核心推动力量。当前,我国经济正处于从以政府主导的投资驱动型的经济“ 阅读全文
posted @ 2023-05-19 21:24 拓端tecdat 阅读(125) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=18770 最近我们被客户要求撰写关于复杂网络分析的研究报告,包括一些图形和统计输出。 为了用R来处理网络数据,我们使用婚礼数据集 ( 查看文末了解数据获取方式 ) 。 CNA 研究和应用爆炸式增长的突出原因是两个因素 - 一个是廉价而强大的计算机的 阅读全文
posted @ 2023-05-18 23:38 拓端tecdat 阅读(38) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23689 最近我们被客户要求撰写关于长短期记忆神经网络的研究报告,包括一些图形和统计输出。 本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测 ( 点击文末“阅读原文”获取完整代码数据******** )。 在本文中 阅读全文
posted @ 2023-05-18 23:37 拓端tecdat 阅读(85) 评论(0) 推荐(0) 编辑
摘要:全文下载链接: http://tecdat.cn/?p=3765 最近我们被客户要求撰写关于PSTR的研究报告,包括一些图形和统计输出。 在本文中,建模过程包括三个阶段:表述,估计和评估,本文帮助用户进行模型表述、估计,进行PSTR模型评估 ( 点击文末“阅读原文”获取完整代码数据********  阅读全文
posted @ 2023-05-18 23:35 拓端tecdat 阅读(130) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22862 最近我们被客户要求撰写关于风险价值VaR的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度 ( 点击文末“阅读原文”获取完整代码数据******** ) 阅读全文
posted @ 2023-05-18 23:34 拓端tecdat 阅读(96) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32462 原文出处:拓端数据部落公众号 分析师:Chang Zhang 贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。贝叶斯网络在信息不完备的情况下通过可以观察随机变量推断不可观察的随机变量,对于解决复 阅读全文
posted @ 2023-05-18 23:33 拓端tecdat 阅读(111) 评论(0) 推荐(0) 编辑
摘要:完整报告链接:http://tecdat.cn/?p=28579 作者:Nuo Liu 最近我们被客户要求撰写关于WEKA的研究报告,包括一些图形和统计输出。 数据变得越来越重要,其核心应用“预测”也成为互联网行业以及产业变革的重要力量。近年来网络 P2P借贷发展形势迅猛,一方面普通用户可以更加灵活 阅读全文
posted @ 2023-05-17 23:38 拓端tecdat 阅读(57) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=9564 最近我们被客户要求撰写关于多元回归的研究报告,包括一些图形和统计输出。 我从马里兰州生物流调查中提取了一些数据,以进行多元回归分析。数据因变量是每75米长的水流中长鼻鱼(Rhinichthys cataractae)的数量。自变量是河流流失 阅读全文
posted @ 2023-05-17 23:36 拓端tecdat 阅读(49) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=2857 最近我们被客户要求撰写关于贝叶斯的研究报告,包括一些图形和统计输出。 本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响,并且对比rjags R2ja 阅读全文
posted @ 2023-05-17 23:35 拓端tecdat 阅读(69) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2657 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 本文展示了如何基于基础ARMA-GARCH过程(当然这也涉及广义上的QRM)来拟合和预测风险价值(Value-at-Risk,VaR) library(qrmtool 阅读全文
posted @ 2023-05-17 23:33 拓端tecdat 阅读(35) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32427 原文出处:拓端数据部落公众号 分析师:Xueyan Liu 在当前海量数据和资源的情况下,面对客户需求,如何找准需求标的和问题核心,并围绕该目标问题挖掘数据、确定市场重要关联因素、分层分类筛选可能关联因素,是当前数据分析运用的关键。 解决 阅读全文
posted @ 2023-05-17 23:31 拓端tecdat 阅读(85) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=18770 最近我们被客户要求撰写关于复杂网络分析的研究报告,包括一些图形和统计输出。 复杂网络分析研究如何识别、描述、可视化和分析复杂网络。 为了用R来处理网络数据,我们使用婚礼数据集 CNA 研究和应用爆炸式增长的突出原因是两个因素 - 一个是廉 阅读全文
posted @ 2023-05-16 23:25 拓端tecdat 阅读(31) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=26915 最近我们被客户要求撰写关于零膨胀泊松回归的研究报告,包括一些图形和统计输出。 零膨胀泊松回归用于对超过零计数的计数数据进行建模。此外,理论表明,多余的零点是通过与计数值不同的过程生成的,并且可以独立地对多余的零点进行建模。因此,zip模型 阅读全文
posted @ 2023-05-16 23:23 拓端tecdat 阅读(99) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=23524 最近我们被客户要求撰写关于采样的研究报告,包括一些图形和统计输出。 在本文中,我想向你展示如何使用R的Metropolis采样从贝叶斯Poisson回归模型中采样。 Metropolis-Hastings算法 Metropolis-H 阅读全文
posted @ 2023-05-16 23:21 拓端tecdat 阅读(69) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23000 最近我们被客户要求撰写关于分解商业周期时间序列的研究报告,包括一些图形和统计输出。 本文包含各种过滤器,可用于分解南非GDP的方法。我们做的第一件事是清除当前环境中的所有变量。这可以通过以下命令进行 分解南非GDP数据 本文包含各种过滤器 阅读全文
posted @ 2023-05-16 23:20 拓端tecdat 阅读(62) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32418 原文出处:拓端数据部落公众号 大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。 人们在投资时总期望以最小的风险获取最大的利益,面对庞大的股票市场和繁杂的股票数据,要想对股票进行合理的分 阅读全文
posted @ 2023-05-16 23:18 拓端tecdat 阅读(84) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=5620 最近我们被客户要求撰写关于金融应用编程的研究报告,包括一些图形和统计输出。 在本文中随机过程对定量融资的许多方面都很有用,包括但不限于衍生品定价,风险管理和投资管理 这些应用程序将在本文后面进一步详细讨论。本节介绍了量化融资中使用的一些流行 阅读全文
posted @ 2023-05-15 23:29 拓端tecdat 阅读(40) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=12111 最近我们被客户要求撰写关于Heston随机波动率的研究报告,包括一些图形和统计输出。 在本文中,我将向您展示如何模拟股票价格的Heston随机波动率模型 Heston模型是一种期权估值方法,它考虑到同一资产在给定时间交易的不同期权的波动性 阅读全文
posted @ 2023-05-15 23:28 拓端tecdat 阅读(95) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=17835 最近我们被客户要求撰写关于股市可视化的研究报告,包括一些图形和统计输出。 本文在股市可视化中可视化相关矩阵 :最小生成树 在本文示例中,我将使用日数据和1分钟数据来可视化股票数据 。 我发现以下概念定义非常有用: 连通图:在无向图中,若任 阅读全文
posted @ 2023-05-15 23:26 拓端tecdat 阅读(30) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5277 最近我们被客户要求撰写关于递归神经网络的研究报告,包括一些图形和统计输出。 本文分析了S&P500指数和SPY ETF,VIX指数和VXX ETN的波动率的可预测性和可交易性。尽管已有大量关于预测高频波动的文献,但大多数仅根据统计误差评估预 阅读全文
posted @ 2023-05-15 23:25 拓端tecdat 阅读(35) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32393 原文出处:拓端数据部落公众号 本文模拟了在连续和离散时间布朗演化一些简单的方法。布朗运动的数学模型(也称为随机游动)也可以用来描述许多现象以及微小颗粒的随机运动, 如股市的波动和在化石中的物理特性的演变。 布朗运动是随机模式,即改变了从一 阅读全文
posted @ 2023-05-15 23:24 拓端tecdat 阅读(84) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24002 最近我们被客户要求撰写关于非线性降维技术的研究报告,包括一些图形和统计输出。 T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入 阅读全文
posted @ 2023-05-12 21:55 拓端tecdat 阅读(137) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=7553 最近我们被客户要求撰写关于出租车GPS轨迹数据的研究报告,包括一些图形和统计输出。 通过解析原始数据 ,得到模式如下所示 数据 每次骑行都有非常具体的上/下车位置以及开始/结束时间的详细信息。 下面显示了一个示例 : 我们留下了158,32 阅读全文
posted @ 2023-05-12 21:54 拓端tecdat 阅读(52) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=10911 最近我们被客户要求撰写关于推荐系统的研究报告,包括一些图形和统计输出。 用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品 1. 用户和产品的潜在特征 我们可以通过为每个用户和每部电影分配属性,然后将它们相乘并合 阅读全文
posted @ 2023-05-12 21:53 拓端tecdat 阅读(108) 评论(0) 推荐(0) 编辑
摘要:报告链接:http://tecdat.cn/?p=32389 原文出处:拓端数据部落公众号 新冠疫情等对商业活动进行了重新塑造,并使金融活动在商业活动中的位置发生了变化。在可持续发展的时代背景下,财务人员需要适应新的工作模式,主动接受新的技术,将关注的重点从传统的财务报告范围拓展到可持续性、包容性和 阅读全文
posted @ 2023-05-12 21:51 拓端tecdat 阅读(103) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32380 原文出处:拓端数据部落公众号 分析师:Zhuhua Huang 在多项用户数据中寻找与预测值相关的属性。查看各个特征的分布与特征之间的关联。分析用户数据,查看特定人群的使用习惯进行产品优化。最后选择合适的模型与参数来进行预测。 解决方案 阅读全文
posted @ 2023-05-12 21:50 拓端tecdat 阅读(46) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22328 最近我们被客户要求撰写关于局部加权回归的研究报告,包括一些图形和统计输出。 目前,回归诊断不仅用于一般线性模型的诊断,还被逐步推广应用于广义线性模型领域(如用于logistic回归模型),但由于一般线性模型与广义线性模型在残差分布的假定等 阅读全文
posted @ 2023-05-11 19:57 拓端tecdat 阅读(141) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23652 最近我们被客户要求撰写关于贝叶斯回归的研究报告,包括一些图形和统计输出。 本文为读者提供了如何进行贝叶斯回归的基本教程。包括完成导入数据文件、探索汇总统计和回归分析 在本文中,我们首先使用软件的默认先验设置。在第二步中,我们将应用用户指定 阅读全文
posted @ 2023-05-11 19:56 拓端tecdat 阅读(26) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=12111 最近我们被客户要求撰写关于期权定价的研究报告,包括一些图形和统计输出。 在本文中,我将向您展示如何模拟股票价格的Heston随机波动率模型 Heston模型是一种期权估值方法,它考虑到同一资产在给定时间交易的不同期权的波动性变化。它试图通 阅读全文
posted @ 2023-05-11 19:54 拓端tecdat 阅读(91) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=17685 最近我们被客户要求撰写关于马尔可夫区制转移模型的研究报告,包括一些图形和统计输出。 我们被要求在本周提供一个报告,该报告将结合金融统计,优化等数值方法 分析师通常关心检测市场何时“发生变化”:几个月或几年内市场的典型行为可以立即转变为非常 阅读全文
posted @ 2023-05-11 19:53 拓端tecdat 阅读(92) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32372 原文出处:拓端数据部落公众号 对于影响北京市GDP 因素分析常用的方法是最小二乘回归。【1】但最小二乘有自身的缺陷,该方法要求较高,例如许多观测数据很难满足全部假设条件。相比普通最小二乘法只能描述协变量对因变量条件均值变化的影响,分位数回 阅读全文
posted @ 2023-05-11 19:52 拓端tecdat 阅读(57) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=31630 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 普通的模型对于两个序列的波动分析一般是静态的,但是dcc-garch模型可以实现他们之间动态相关的波动分析,即序列间波动并非为一个常数,而是一个随着时间的变化而变化 阅读全文
posted @ 2023-05-10 21:28 拓端tecdat 阅读(58) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=24172 最近我们被客户要求撰写关于潜过程混合效应模型(lcmm)的研究报告,包括一些图形和统计输出。 每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。有时,这个潜过程是通过几个标志来衡量的,因此潜过程是它们的共同 阅读全文
posted @ 2023-05-10 21:26 拓端tecdat 阅读(99) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=31108 最近我们被客户要求撰写关于VAR模型的研究报告,包括一些图形和统计输出。 作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。 对此问题的研究显然具有重要的学术价值与现实 阅读全文
posted @ 2023-05-10 21:25 拓端tecdat 阅读(87) 评论(0) 推荐(0) 编辑
摘要:报告链接:http://tecdat.cn/?p=32361 原文出处:拓端数据部落公众号 这份报告探讨了公司主管们对于新科技的看法,并探讨了他们对于5G、物联网的投资方案,同时也探讨了公司对于提供商和合作生态系统的看法。最后,根据本研究之发现,提出相关之建议,以供业界参考。 效率和优化等好处激励着 阅读全文
posted @ 2023-05-10 21:23 拓端tecdat 阅读(29) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32355 原文出处:拓端数据部落公众号 分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里。虽然都是把某个对象划分到某个类别中,但是分类的类别是已经预定义的,而聚类操作时,某个对象所属的类别却不是预 阅读全文
posted @ 2023-05-10 21:21 拓端tecdat 阅读(88) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=23681 最近我们被客户要求撰写关于线性混合效应的研究报告,包括一些图形和统计输出。 线性混合效应模型与我们已经知道的线性模型有什么不同? 线性混合模型(有时被称为 "多层次模型 "或 "层次模型",取决于上下文)是一种回归模型,它同时考虑了( 阅读全文
posted @ 2023-05-09 22:49 拓端tecdat 阅读(73) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=23378 最近我们被客户要求撰写关于高维数据惩罚回归方法的研究报告,包括一些图形和统计输出。 在本文中,我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。这些数据来源于哺乳动物眼组织样本的微阵列实验 1 介绍 在本文中 阅读全文
posted @ 2023-05-09 22:47 拓端tecdat 阅读(75) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=12310 最近我们被客户要求撰写关于自然语言处理NLP的研究报告,包括一些图形和统计输出。 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴 ▼ 为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向 阅读全文
posted @ 2023-05-09 22:45 拓端tecdat 阅读(19) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22956 最近我们被客户要求撰写关于贝叶斯网络的研究报告,包括一些图形和统计输出。 贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。它是一个图形模型,我们可以很容易地检查变量的条件依赖性和它们在图中的方向 阅读全文
posted @ 2023-05-09 22:44 拓端tecdat 阅读(26) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32345 原文出处:拓端数据部落公众号 本文深入分析了国内外关于股权结构与公司绩效的影响因素; 帮助客户运用回归分析法,以ROE作为公司绩效的度量指标,考察中小企业板上市公司股权集中度、股权制衡度对公司绩效的影响因素。 为了进行实证研究,选取了部分 阅读全文
posted @ 2023-05-09 22:42 拓端tecdat 阅读(113) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22945 最近我们被客户要求撰写关于动态时间规整算法的研究报告,包括一些图形和统计输出 动态时间扭曲算法何时、如何以及为什么可以有力地取代常见的欧几里得距离,以更好地对时间序列数据进行分类 时间序列分类的动态时间扭曲 使用机器学习算法对时间序列进行 阅读全文
posted @ 2023-05-08 23:47 拓端tecdat 阅读(97) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=31162 最近我们被客户要求撰写关于SV模型的研究报告,包括一些图形和统计输出 本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。 模拟SV模型的估计方法: sim <- svsim(1000,mu=-9 阅读全文
posted @ 2023-05-08 23:45 拓端tecdat 阅读(39) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=9706 最近我们被客户要求撰写关于非线性模型的研究报告,包括一些图形和统计输出。 在这文中,我将介绍非线性回归的基础知识。非线性回归是一种对因变量和一组自变量之间的非线性关系进行建模的方法。最后我们用R语言非线性模型预测个人工资数据是否每年收入超过 阅读全文
posted @ 2023-05-08 23:44 拓端tecdat 阅读(44) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=23378 最近我们被客户要求撰写关于高维数据惩罚回归方法的研究报告,包括一些图形和统计输出。 在本文中,我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。这些数据来源于哺乳动物眼组织样本的微阵列实验 1 介绍 在本文中 阅读全文
posted @ 2023-05-08 23:42 拓端tecdat 阅读(44) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32316 原文出处:拓端数据部落公众号 我们常说的中药挖掘,一般是用药挖掘,还有穴位的挖掘,主要是想找出一些用药的规律。在中医挖掘中,数据的来源比较广泛,有的是通过临床收集用药处方,比如,一个著名老中医针对某一疾病的用药情况;有的是通过古籍,古代流 阅读全文
posted @ 2023-05-08 23:41 拓端tecdat 阅读(78) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5277 最近我们被客户要求撰写关于递归神经网络的研究报告,包括一些图形和统计输出。 本文分析了S&P500指数和SPY ETF,VIX指数和VXX ETN的波动率的可预测性和可交易性。尽管已有大量关于预测高频波动的文献,但大多数仅根据统计误差评估预 阅读全文
posted @ 2023-05-06 21:45 拓端tecdat 阅读(24) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24346 最近我们被客户要求撰写关于用户流失数据挖掘的研究报告,包括一些图形和统计输出。 在今天产品高度同质化的品牌营销阶段,企业与企业之间的竞争集中地体现在对客户的争夺上 “用户就是上帝”促使众多的企业不惜代价去争夺尽可能多的客户。但是企业在不惜 阅读全文
posted @ 2023-05-06 21:44 拓端tecdat 阅读(61) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=20015 最近我们被客户要求撰写关于金融时间序列的研究报告,包括一些图形和统计输出。 本文将说明单变量和多变量金融时间序列的不同模型,特别是条件均值和条件协方差矩阵、波动率的模型 均值模型 本节探讨条件均值模型。 iid模型 我们从简单的iid 阅读全文
posted @ 2023-05-06 21:42 拓端tecdat 阅读(64) 评论(0) 推荐(0) 编辑
摘要:原文链接 :http://tecdat.cn/?p=3726 最近我们被客户要求撰写关于时间序列聚类的研究报告,包括一些图形和统计输出。 本文我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列 企业对企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的 阅读全文
posted @ 2023-05-06 21:40 拓端tecdat 阅读(43) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32307 原文出处:拓端数据部落公众号 互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个尝试。 文本聚类其实也就 阅读全文
posted @ 2023-05-06 21:39 拓端tecdat 阅读(52) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32295 原文出处:拓端数据部落公众号 临床决策(clinical decision making)是医务人员在临床实践过程中,根据国内外医学科研的最新进展,不断提出新方案,与传统方案进行比较后,取其最优者付诸实施,从而提高疾病诊治水平的过程。 在 阅读全文
posted @ 2023-05-05 22:37 拓端tecdat 阅读(82) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=32284 原文出处:拓端数据部落公众号 随着社会的发展,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。而大数据的意义并不在“大”,而在于“有用”。价值含量、挖掘成本比 阅读全文
posted @ 2023-05-05 22:35 拓端tecdat 阅读(70) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示