11 2022 档案

摘要:原文链接:http://tecdat.cn/?p=5277 本文分析了S&P500指数和SPY ETF,VIX指数和VXX ETN的波动率的可预测性和可交易性。我们围绕高频波动率技术进行一些咨询,帮助客户解决独特的业务问题。尽管已有大量关于预测高频波动的文献,但大多数仅根据统计误差评估预测 ( 点击 阅读全文
posted @ 2022-11-30 20:57 拓端tecdat 阅读(152) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6864 我们围绕文本挖掘技术进行一些咨询,帮助客户解决独特的业务问题。 我们对20个Usenet公告板的20,000条消息进行分析 ( 点击文末“阅读原文”获取完整代码数据******** )。 此数据集中的Usenet公告板包括新汽车,体育和密码 阅读全文
posted @ 2022-11-30 20:56 拓端tecdat 阅读(95) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=25348 我们围绕极值分析技术进行一些咨询,帮助客户解决独特的业务问题。 你们可能知道,实际极值分析有两种常用方法:分块极大值Block-maxima、阈值超额法threshold excess ( 点击文末“阅读原文”获取完整代码数据****** 阅读全文
posted @ 2022-11-30 20:55 拓端tecdat 阅读(175) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=20424 时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。时间序列数据的特定属性意味着通常需要专门的统计方法 ( 点击文末“阅读原文”获取完整代码数据******** ) 。 在本教程中,我们将首先介绍和讨论 阅读全文
posted @ 2022-11-30 20:53 拓端tecdat 阅读(130) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30629 Learning Objectives · Use the R environment to do data exploration and data preparation. Submission Information · This 阅读全文
posted @ 2022-11-30 12:03 拓端tecdat 阅读(17) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=1770 冲积图是最初开发用来表示随时间变化的网络结构的一种流程图。为了兼顾它们的视觉外观和对流动的重视,冲积图是以流水堆积的土壤自然形成的冲积扇命名的。变量分配给平行的垂直轴。值由每个轴上的块表示。块的高度表示簇的大小,并且流域的高度表示由流域连接 阅读全文
posted @ 2022-11-30 11:56 拓端tecdat 阅读(132) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=22617 最近我们被客户要求撰写关于MARKOV REGIME SWITCHING的研究报告,包括一些图形和统计输出。 本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Ha 阅读全文
posted @ 2022-11-29 22:10 拓端tecdat 阅读(126) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=21317 最近我们被客户要求撰写关于DLNM的研究报告,包括一些图形和统计输出。 本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联 ( 点击文末“阅读原文”获取完整 阅读全文
posted @ 2022-11-29 22:08 拓端tecdat 阅读(142) 评论(0) 推荐(0) 编辑
摘要:下载全文:http://tecdat.cn/?p=22302 在混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合 ( 点击文末“阅读原文”获取完整代码数据******** ) 。 最近我们被客户要求撰写关于混合效应逻辑 阅读全文
posted @ 2022-11-29 22:06 拓端tecdat 阅读(213) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=2155 随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的时代需求是分不开的 ( 点击文末“阅读原文”获取完整代码数据******** )。 ▼ 阅读全文
posted @ 2022-11-29 22:04 拓端tecdat 阅读(122) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30605 原文出处:拓端数据部落公众号 应用关联规则、聚类方法等数据挖掘技术分析治疗抑郁症的中药专利复方组方配伍规律。方法检索治疗抑郁症中药专利复方,排除外用中药及中西药物合用的复方。最近我们被要求撰写关于用药规律的研究报告,包括一些图形和统计输出 阅读全文
posted @ 2022-11-29 22:03 拓端tecdat 阅读(136) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=19751 本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类 。 最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。 要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入 阅读全文
posted @ 2022-11-28 21:27 拓端tecdat 阅读(240) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=27099 金融资产/证券已使用多种技术进行建模。该项目的主要目标是使用几何布朗运动模型和蒙特卡罗模拟来模拟股票价格。该模型基于受乘性噪声影响的随机(与确定性相反)变量 ( 点击文末“阅读原文”获取完整代码数据******** )。 最近我们被客户要 阅读全文
posted @ 2022-11-28 21:25 拓端tecdat 阅读(257) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=21317 本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联。 最近我们被客户要求撰写关于DLNM的研究报告,包括一些图形和统计输出。 数据 数据集包含1987-20 阅读全文
posted @ 2022-11-28 21:24 拓端tecdat 阅读(107) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=24647 线性混合模型假设 N 个受试者的群体是同质的,并且在群体水平上由独特的曲线 Xi(t)β 描述 。 最近我们被客户要求撰写关于线性混合模型的研究报告,包括一些图形和统计输出。 背景和定义 相比之下,潜在类别混合模型在于假设人口是异质的 阅读全文
posted @ 2022-11-28 21:23 拓端tecdat 阅读(109) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30597 原文出处:拓端数据部落公众号 最近我们被要求解决时间序列异常检验的问题。有客户在使用大量的时间序列。这些时间序列基本上是每10分钟进行一次的网络测量,其中一些是周期性的(即带宽),而另一些则不是(即路由流量)。 他想要一个简单的算法来进行 阅读全文
posted @ 2022-11-28 21:19 拓端tecdat 阅读(149) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30589 熟悉和掌握SCI文章的写作格式是发表SCI论文的基本要求,很多作者不能高度重视格式要求,可能会影响文章的发表,也许等待文章录用通知的时间就在这里。 SCI论文格式主要分为3部分:1.前言部分,2.主题部分,3.正文部分。 SCI论文格式前 阅读全文
posted @ 2022-11-27 16:09 拓端tecdat 阅读(696) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30583 转眼间已是2022年快结束了。SCI发了几篇?最近由于新冠疫情,各大行业都受到了很大的影响,之前很多医生客户都在问能不能在7月份之前安排论文,本身今年是没有评审职称资格的,但是也因为前面的努力,获得了评审职称的资格,但是这么短的周期真的很 阅读全文
posted @ 2022-11-27 16:08 拓端tecdat 阅读(2461) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30579 目前,在国际科学界,如何正确评价基础科学研究成果已经引起了越来越广泛的关注。而被SCI和SSCI收录的科技论文数量,被认为是衡量一个国家基础科学研究水平、科技实力和科技论文水平的重要评价指标。那么,究竟什么是SCI和SSCI? 一、SCI 阅读全文
posted @ 2022-11-27 16:07 拓端tecdat 阅读(1964) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30574 对于从事基础研究的科学家来说,能否在SCI收录的期刊上发表论文,是能否进入学术前沿领域,在国际公认的同一平台上参与学术竞争,并做出原创性贡献的基本标志。那么,什么样的论文才算合格呢?本文提出了一些建议,供大家参考。 在国际核心期刊上发表学 阅读全文
posted @ 2022-11-27 16:05 拓端tecdat 阅读(349) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30565 一份完整的SCI论文由以下15个主要部分组成 1.标题(Title) 2.作者名单(Authors’name) 3.作者单位(Author affiliation) 4.摘要(Abstract) 5.关键词(Keywords) 6.引言( 阅读全文
posted @ 2022-11-26 12:31 拓端tecdat 阅读(679) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30560 SCI论文提交说明:提交方式 SCI论文的投稿方式有以下几种。 论文提交:一般需要打印几份稿件,邮寄给期刊编辑部,有些期刊还要求提供论文的软盘或光盘。 电子邮件投稿:通过电子邮件将论文作为附件发给编辑。 在线投稿:期刊有在线投稿系统,可在 阅读全文
posted @ 2022-11-26 12:30 拓端tecdat 阅读(837) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30556 想发SCI论文,没有好的idea,都没法开始,又怎么着手写作?优秀的科研人员也不是立马就能想到好的idea,都是经过长时间积累,不断摸索,最终才挖掘出来的。 如果你正处于为没有一个好的idea而烦恼的阶段,你可以尝试做以下几件事: 1.大 阅读全文
posted @ 2022-11-26 12:29 拓端tecdat 阅读(138) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30551 一篇科学论文有多少字?一般来说,SCI论文的字数在3000-6000字之间。确切的字数需要根据投稿期刊的要求来确定。许多作者在论文写完后才选择期刊,这是一个非常不好的习惯。其实,在论文题目确定后,就应该考虑向哪家或哪几家期刊投稿,然后仔细 阅读全文
posted @ 2022-11-26 12:27 拓端tecdat 阅读(753) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30543 对于大多数研究学者来说,发表sci论文是比较困难的,不是每个研究人员都有足够的时间、精力和能力来完成,但也不是不能发。首先要了解sci发表论文的要求,才能提高发表的成功率。今天,我整理了一份sci发表论文的要求,供大家参考学习。如果大家对 阅读全文
posted @ 2022-11-26 12:26 拓端tecdat 阅读(614) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=27384 在本文中,数据包含有关葡萄牙“Vinho Verde”葡萄酒的信息 ( 点击文末“阅读原文”获取完整代码数据******** ) 。最近我们被客户要求撰写关于葡萄酒的研究报告,包括一些图形和统计输出。 介绍 该数据集(查看文末了解数据获取 阅读全文
posted @ 2022-11-25 18:06 拓端tecdat 阅读(557) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=13981 在本文中,随着多媒体技术的不断发展,数码相机,高清拍照手机等多媒体设备己经在人们的生活中占据了越来越重要的地位 。最近我们被客户要求撰写关于图像倾斜校正算法的研究报告,包括一些图形和统计输出。 通过采用图像处理技术,可以将数码设备采 阅读全文
posted @ 2022-11-25 18:03 拓端tecdat 阅读(235) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=11724 最近我们被客户要求撰写关于混合效应模型的研究报告,包括一些图形和统计输出。 文中对多层_回归_模型进行了基本介绍 。 介绍 本教程期望: 多层_回归_模型的基础知识 。 R中编码的基础知识。 安装R软件包 lme4,和 lmerTest。 阅读全文
posted @ 2022-11-25 18:02 拓端tecdat 阅读(121) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=23544 在本文中,长短期记忆网络——通常称为“LSTM”——是一种特殊的RNN递归神经网络,能够学习长期依赖关系 。 最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。 什么是依赖关系? 假设您在观看视频时记得前一个场景, 阅读全文
posted @ 2022-11-25 18:01 拓端tecdat 阅读(115) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=23606 原文出处:拓端数据部落公众号 梯度下降是什么? 最近我们被客户要求撰写关于梯度下降的研究报告,包括一些图形和统计输出。梯度下降是一种优化算法,能够为各种问题找到最佳解决方案。 梯度下降的主要功能是最小化成本函数。 这个定义很难理解,对吧? 阅读全文
posted @ 2022-11-25 17:58 拓端tecdat 阅读(132) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=24057 本文的目标是使用K-最近邻(K近邻),ARIMA和神经网络模型分析Google股票数据集预测Google的未来股价,然后分析各种模型 ( 点击文末“阅读原文”获取完整代码数据******** ) 。 K-最近邻(K近邻)是一种用于回归 阅读全文
posted @ 2022-11-23 17:21 拓端tecdat 阅读(117) 评论(0) 推荐(0) 编辑
摘要:阅读全文:http://tecdat.cn/?p=24198 《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境 。 在本项目中,我将使用世界幸福报告中的数据来探索亚洲22个国家或地区,并通过查看 阅读全文
posted @ 2022-11-23 17:20 拓端tecdat 阅读(171) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=24535 最近,copula 在仿真模型中变得流行起来。Copulas 是描述变量之间依赖关系的函数,并提供了一种创建分布以对相关多元数据建模的方法 使用 copula,数据分析师可以通过指定边缘单变量分布并选择特定的 copula 来提供变量 阅读全文
posted @ 2022-11-23 17:19 拓端tecdat 阅读(198) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=24203 本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型) ( 点击文末“阅读原文”获取完整代码数据******** ) 。 当前教程特别关注贝叶斯逻辑回归在二元结果和计数/比例结果场景中的使用,以及模型评估的相应方法。使用教育 阅读全文
posted @ 2022-11-23 17:17 拓端tecdat 阅读(325) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30508 原文出处:拓端数据部落公众号 现实情况是,我们经常要处理多个自变量和一个因变量之间的关系,此外,虽然通过做散点图可以发现非线性关系,但很难归因其形式,多项式回归在广义线性模型中,由于其不可解释的系数,降低了模型的有用性。 本文使用的广义加 阅读全文
posted @ 2022-11-23 17:13 拓端tecdat 阅读(268) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22596 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究? ( 点击文末“阅读原文”获取完整代码数据******** ) 研究大纲 介绍数据集和 阅读全文
posted @ 2022-11-22 20:37 拓端tecdat 阅读(121) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=25133 2017 年年中,R 推出了 Keras 包 _,_这是一个在 Tensorflow 之上运行的综合库,具有 CPU 和 GPU 功能 本文将演示如何在 R 中使用 LSTM 实现时间序列预测。 简单的介绍 时间序列涉及按时间顺序收集的数 阅读全文
posted @ 2022-11-22 20:37 拓端tecdat 阅读(88) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30478 原文出处:拓端数据部落公众号 复杂网络简介 现实世界中充满了网络世界,铁路线路网络、航空网络和人际关系网络。复杂网络是大量真实复杂系统的拓扑关系。在复杂网络分析的帮助下,我们期望将复杂的东西简化,找到隐藏的拓扑关系的新结构,找到节点与节点 阅读全文
posted @ 2022-11-22 20:30 拓端tecdat 阅读(142) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30452 如何发表医学sci论文? 相信很多科研人员都很头疼如何发表论文,毕竟sci作为科研人员毕业、晋升、提高的终身工具,但不是每个科研人员都有足够的时间、精力和能力去完成。 发表医学科学论文方法一: 前言,介绍自己的研究课题,总结前人的工作,说 阅读全文
posted @ 2022-11-22 20:29 拓端tecdat 阅读(507) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30444 期刊影响因子越高越难发吗? 期刊影响因子代表了期刊近两年的论文引用数据,影响因子越高说明这本期刊收录的论文被引次数高,进一步说明了这本期刊的学术影响力就高。那么是不是期刊影响因子越高就越难呢,我们一起来探讨探讨。 一般来说,很少单位会对期 阅读全文
posted @ 2022-11-22 20:27 拓端tecdat 阅读(439) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=22617 本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器 %matplotlib inline impor 阅读全文
posted @ 2022-11-21 18:29 拓端tecdat 阅读(195) 评论(0) 推荐(0) 编辑
摘要:全文下载:http://tecdat.cn/?p=22319 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点和只使用所选变量的子集来 "清洗 "你的数据 。 步骤 建立PLS回归模型 阅读全文
posted @ 2022-11-21 18:26 拓端tecdat 阅读(354) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2687 在贝叶斯方法中,马尔可夫链蒙特卡罗方法尤其神秘 它们肯定是数学繁重且计算量大的过程,但它们背后的基本推理,就像数据科学中的许多其他东西一样,可以变得直观。这就是我的目标。 那么,什么是马尔可夫链蒙特卡罗(MCMC)方法?简短的回答是: MC 阅读全文
posted @ 2022-11-21 18:24 拓端tecdat 阅读(177) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=27515 建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析,在借鉴了相关评价理论和评价方法的基础上,本文提取出经济规模、人均发展水平、经济发展潜力、3个主因子,从重庆市统计年鉴选取8个指标构成的指标体系数据 阅读全文
posted @ 2022-11-21 18:22 拓端tecdat 阅读(99) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30426 原文出处:拓端数据部落公众号 对VaR计算方法的改进,以更好的度量开放式基金的风险。本文把基金所持股票看成是一个投资组合,引入Copula来描述多只股票间的非线性相关性,构建多元GARCH-EVT-Copula模型来度量开放式基金的风险, 阅读全文
posted @ 2022-11-21 18:21 拓端tecdat 阅读(151) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=22511 标准的ARIMA(移动平均自回归模型)模型允许只根据预测变量的过去值进行预测。 该模型假定一个变量的未来的值线性地取决于其过去的值,以及过去(随机)影响的值。ARIMAX模型是ARIMA模型的一个扩展版本。它还包括其他独立(预测)变量 阅读全文
posted @ 2022-11-18 18:47 拓端tecdat 阅读(224) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22273 如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除 动机 它有两个非常自然的用途,第一个是变量选择,第二个是预测。因为通常情况下,LASSO选择的变量会比普 阅读全文
posted @ 2022-11-18 18:44 拓端tecdat 阅读(140) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=3230 作为第一步,从一个不包含协变量的空模型开始 ( 点击文末“阅读原文”获取完整代码数据******** )。 每所学校的截距,β 0J,然后设置为平均,γ 00,和随机误差ü 0J。 将(2)代入(1)产生 要在SPSS中进行估算,请转至分析 阅读全文
posted @ 2022-11-18 18:43 拓端tecdat 阅读(574) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=26897 风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险 风险价值 (VaR) VaR 可以定义为资产在给定时间段内以概率 θ 超过的市场价值损失。对于收益率 rt 的时间序列,VaRt 阅读全文
posted @ 2022-11-18 18:41 拓端tecdat 阅读(504) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30413 原文出处:拓端数据部落公众号 开源软件存储库上有数千个开源软件,可以从中免费使用该软件。为了能够有效和高效地识别用户所需的软件,已根据软件的功能和属性向软件判断了标记。因此,标签分配成为开源软件存储库软件维护成功的关键。手动分配需要专家判 阅读全文
posted @ 2022-11-18 18:39 拓端tecdat 阅读(157) 评论(0) 推荐(0) 编辑
摘要:全文链接: http://tecdat.cn/?p=2596 在本文中,我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率 1.混合模型是否适合您的需求? 混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。混合模型的输出将为解释值列 阅读全文
posted @ 2022-11-17 17:25 拓端tecdat 阅读(537) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=22617 本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器 %matplotlib inline impor 阅读全文
posted @ 2022-11-17 17:24 拓端tecdat 阅读(104) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30401 原文出处:拓端数据部落公众号 本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。我们被客户要求撰写关于CPV模型的研究报告。结果表明, 该模型在度量和预测房地产信贷违约率方面具有较好的效果。 CPV 模型的基本原理和框架 CPV 阅读全文
posted @ 2022-11-17 17:21 拓端tecdat 阅读(175) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30396 Directions: Complete the following exercises using the code discussed during computer lab. Save your work in an R scrip 阅读全文
posted @ 2022-11-17 17:19 拓端tecdat 阅读(26) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30394 Complete the following exercises using the code discussed during computer lab. Save your work in an R script as well as 阅读全文
posted @ 2022-11-17 17:16 拓端tecdat 阅读(41) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22721 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择 根据惩罚项的大小,LASSO将不太相关的预测因子缩小到(可能)零。因此,它使我们能够考虑一个更 阅读全文
posted @ 2022-11-16 18:04 拓端tecdat 阅读(139) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=22273 如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除 动机 它有两个非常自然的用途,第一个是变量选择,第二个是预测。因为通常情况下,LASSO选择的变量会比普 阅读全文
posted @ 2022-11-16 18:02 拓端tecdat 阅读(127) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=27340 最近我们被客户要求撰写关于波动率的研究报告。 波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)。 甚至波动率本身也是一种金融工具,例如 CBOE 的 阅读全文
posted @ 2022-11-16 17:56 拓端tecdat 阅读(164) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=11724 最近我们被客户要求撰写关于混合效应模型的研究报告。 介绍 本教程期望: 多层_回归_模型的基础知识 。 R中编码的基础知识。 安装R软件包 lme4,和 lmerTest。 步骤1:设定 如果尚未安装所有下面提到的软件包,则可以通过命令安 阅读全文
posted @ 2022-11-16 17:54 拓端tecdat 阅读(124) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30360 原文出处:拓端数据部落公众号 随着网络的迅速发展,依托于网络的购物作为一种新型的消费方式,在全国乃至全球范围内飞速发展。电子商务成为越来越多消费者购物的重要途径。我们被客户要求撰写关于网络购物行为的研究报告。 项目计划使用数据挖掘的方法, 阅读全文
posted @ 2022-11-16 17:51 拓端tecdat 阅读(126) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=16845 本文依靠EVT对任何连续分布的尾部建模。尾部建模,尤其是POT建模,对于许多金融和环境应用至关重要 POT模型其主要动机是为高洪水流量的概率模型提供实用工具。但是,EVT的优势在于结果不取决于要建模的过程。因此,人们可以使用POT来分析降 阅读全文
posted @ 2022-11-15 17:19 拓端tecdat 阅读(276) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=19751 本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。 要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入网络,并根据序列数据的各个时间步进行预测。 本示例使用日语元音数据集。此示 阅读全文
posted @ 2022-11-15 17:18 拓端tecdat 阅读(513) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30330 原文出处:拓端数据部落公众号 团队需要分析一个来自在线零售商的数据。该数据集包含了78周的购买历史。该数据文件中的每条记录包括四个字段。 客户的ID(从1到2357不等),交易日期,购买的书籍数量,以及价值。 我们被要求建立一个模型来预测 阅读全文
posted @ 2022-11-15 17:16 拓端tecdat 阅读(150) 评论(0) 推荐(0) 编辑
摘要:全文下载链接: http://tecdat.cn/?p=22482 在本文中,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 引言 本教程的目的是帮助你学习如何在R中开发一个BRT模型。 示例数据 有两套短鳍鳗的记录数据。一个用于模型训练(建 阅读全文
posted @ 2022-11-15 17:11 拓端tecdat 阅读(48) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22546 什么是随机波动率?随机波动率 (SV) 是指资产价格的波动率是变化的而不是恒定的 。 “随机”一词意味着某些变量是随机确定的,无法精确预测。 在金融建模的背景下,随机建模迭代随机变量的连续值,这些值彼此不独立。非独立的意思是虽然变量的值会 阅读全文
posted @ 2022-11-15 17:09 拓端tecdat 阅读(97) 评论(0) 推荐(0) 编辑
摘要:阅读全文:http://tecdat.cn/?p=8522 分类问题属于机器学习问题的类别,其中给定一组特征,任务是预测离散值。分类问题的一些常见示例是,预测肿瘤是否为癌症,或者学生是否可能通过考试。 在本文中,鉴于银行客户的某些特征,我们将预测客户在6个月后是否可能离开银行。客户离开组织的现象也称 阅读全文
posted @ 2022-11-15 17:07 拓端tecdat 阅读(283) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=12174 本文比较了几个时间序列模型,以预测SP500指数的每日实际波动率。基准是SPX日收益序列的ARMA-EGARCH模型。将其与GARCH模型进行比较 。最后,提出了集合预测算法 。 假设条件 实际波动率是看不见的,因此我们只能对其进行估 阅读全文
posted @ 2022-11-15 17:04 拓端tecdat 阅读(145) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=23061 这个数据集可以追溯到1988年,由四个数据库组成。克利夫兰、匈牙利、瑞士和长滩。"目标 "字段是指病人是否有心脏病。它的数值为整数,0=无病,1=有病 。 数据集信息: 目标: 主要目的是预测给定的人是否有心脏病,借助于几个因素,如年龄、 阅读全文
posted @ 2022-11-15 17:02 拓端tecdat 阅读(405) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=18850 原文出处:拓端数据部落公众号 相关视频:在Python和R语言中建立EWMA,ARIMA模型预测时间序列 在本文中我们对在Google趋势上的关键字“ Chocolate ”序列进行预测。序列如下 > report = read.csv( 阅读全文
posted @ 2022-11-14 15:35 拓端tecdat 阅读(62) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=11680 这篇文章的目的是指导读者逐步使用R编程语言实现Nelson-Siegel模型的步骤。您可能已经知道,估计利率期限结构是任何资产定价的关键,因此对投资者和政策制定者起着重要的作用 ( 点击文末“阅读原文”获取完整代码数据 )。 想法是使一条 阅读全文
posted @ 2022-11-14 14:55 拓端tecdat 阅读(167) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=27515 建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析,在借鉴了相关评价理论和评价方法的基础上,本文提取出经济规模、人均发展水平、经济发展潜力、3个主因子,从重庆市统计年鉴选取8个指标构成的指标体系数据 阅读全文
posted @ 2022-11-14 14:53 拓端tecdat 阅读(134) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=13981 在本文中,随着多媒体技术的不断发展,数码相机,高清拍照手机等多媒体设备己经在人们的生活中占据了越来越重要的地位 ( 点击文末“阅读原文”获取完整代码数据******** ) 。 通过采用图像处理技术,可以将数码设备采 集到的文字、图片 阅读全文
posted @ 2022-11-14 14:52 拓端tecdat 阅读(440) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=6962 假设 有时间序列数据,如下所示。经验表明,目标变量y似乎与解释变量x有关。然而,乍一看,y在水平中间波动,所以它似乎并不总是有稳定的关系(背后有多个状态) ( 点击文末“阅读原文”获取完整代码数据******** )。 上面的样本数据创建如 阅读全文
posted @ 2022-11-14 14:51 拓端tecdat 阅读(180) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=11617 在这篇文章中,我将对多元线性回归使用block的Gibbs采样,得出block的Gibbs采样所需的条件后验分布。然后,对采样器进行编码,并使用模拟数据对其进行测试 ( 点击文末“阅读原文”获取完整代码数据 )。 贝叶斯模型 假设我们有一 阅读全文
posted @ 2022-11-14 14:48 拓端tecdat 阅读(195) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=11724 文中本教程对多层_回归_模型进行了基本介绍 ( 点击文末“阅读原文”获取完整代码数据******** ) 。 介绍 本教程期望: 多层_回归_模型的基础知识 。 R中编码的基础知识。 安装R软件包 lme4,和 lmerTest。 步骤1 阅读全文
posted @ 2022-11-14 14:47 拓端tecdat 阅读(120) 评论(0) 推荐(0) 编辑
摘要:全文下载链接: http://tecdat.cn/?p=22482 在本文中,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 ( 点击文末“阅读原文”获取完整代码数据******** ) 引言 本教程的目的是帮助你学习如何在R中开发一个BRT 阅读全文
posted @ 2022-11-14 14:44 拓端tecdat 阅读(14) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=27078 时序数据的聚类方法,该算法按照以下流程执行。 ( 点击文末“阅读原文”获取完整代码数据 )。 使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列聚类的质心。(一种新的基于质心的聚类算法,可保留时间序列的形状) 阅读全文
posted @ 2022-11-11 17:31 拓端tecdat 阅读(83) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=18700 本文说明了R语言中实现分布滞后线性和非线性模型(DLM和DLNM)的建模。首先,本文描述了除时间序列数据之外的DLM / DLNM的一般化方法,在Gasparrini [2014]中有更详细的描述 ( 点击文末“阅读原文”获取完整代码 阅读全文
posted @ 2022-11-11 17:29 拓端tecdat 阅读(533) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=20424 时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。时间序列数据的特定属性意味着通常需要专门的统计方法 ( 点击文末“阅读原文”获取完整代码数据 ) 。 在本教程中,我们将首先介绍和讨论自相关,平稳性和 阅读全文
posted @ 2022-11-11 17:27 拓端tecdat 阅读(174) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=19469 本文将分析工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和 ( 点击文末“阅读原文”获取完整代码数据 ) 。 时间序列分析模型 ARI 阅读全文
posted @ 2022-11-11 17:25 拓端tecdat 阅读(220) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=30169 原文出处:拓端数据部落公众号 时间序列分类的动态时间扭曲 动态时间扭曲算法何时、如何以及为什么可以有力地取代常见的欧几里得距离,以更好地对时间序列数据进行分类 使用机器学习算法对时间序列进行分类需要一定的熟悉程度。 时间序列分类(TSC) 阅读全文
posted @ 2022-11-11 17:21 拓端tecdat 阅读(233) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=19006 最新研究表明,中国有超过7亿人在观看在线视频内容。Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个弹幕视频网站,最大的年轻人潮流文化娱乐社区,截至2020年3月31日的第一季度它已经拥有超过1.7亿的月度用户,反映了许多人认 阅读全文
posted @ 2022-11-10 20:08 拓端tecdat 阅读(152) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19077 自组织映射 (SOM)是一种工具,通过生成二维表示来可视化高维数据中的模式,在高维结构中显示有意义的模式 ( 点击文末“阅读原文”获取完整代码数据******** )。 导入 通过以下方式使用给定的数据(或数据样本)对SOM进行“训练”: 阅读全文
posted @ 2022-11-10 20:02 拓端tecdat 阅读(180) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2687 在贝叶斯方法中,马尔可夫链蒙特卡罗方法尤其神秘 ( 点击文末“阅读原文”获取完整代码数据******** )。 它们肯定是数学繁重且计算量大的过程,但它们背后的基本推理,就像数据科学中的许多其他东西一样,可以变得直观。这就是我的目标。 那么 阅读全文
posted @ 2022-11-10 19:52 拓端tecdat 阅读(153) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22262 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量) ( 点击文末“阅读原文”获取完整代码数据******** )。 但在实际生活中,有更多的观察值,更多的解释变量。随着两个以上的解释变量,它开始变得更加复杂的可视化。 数据 我们 阅读全文
posted @ 2022-11-10 19:49 拓端tecdat 阅读(131) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22721 Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择 根据惩罚项的大小,LASSO将不太相关的预测因子缩小到(可能)零。因此,它使我们能够考虑一个更 阅读全文
posted @ 2022-11-09 18:38 拓端tecdat 阅读(218) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=2858 本文的目的是对如何在R中进行生存分析进行简短而全面的评估。关于该主题的文献很广泛,仅涉及有限数量的(常见)问题。可用的R包数量反映了对该主题的研究范围。 ( 点击文末“阅读原文”获取完整代码数据******** )。 视频:R语言生存分析原 阅读全文
posted @ 2022-11-09 18:37 拓端tecdat 阅读(631) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=20904 环境科学中的许多数据不适合简单的线性模型,最好用广义相加模型(GAM)来描述 。 这基本上就是具有 光滑函数的广义线性模型(GLM)的扩展 。当然,当您使用光滑项拟合模型时,可能会发生许多复杂的事情,但是您只需要了解基本原理即可。 相 阅读全文
posted @ 2022-11-09 18:34 拓端tecdat 阅读(303) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24814 说到在股票市场上赚钱,有无数种不同的赚钱方式。似乎在金融界,无论你走到哪里,人们都在告诉你应该学习 Python 毕竟,Python 是一种流行的编程语言,可用于所有类型的领域,包括数据科学。有大量软件包可以帮助您实现目标,许多公司使用 阅读全文
posted @ 2022-11-09 18:33 拓端tecdat 阅读(399) 评论(0) 推荐(0) 编辑
摘要:阅读全文:http://tecdat.cn/?p=6193 copula是将多变量分布函数与其边缘分布函数耦合的函数,通常称为边缘。在本视频中,我们通过可视化的方式直观地介绍了Copula函数,并通过R软件应用于金融时间序列数据来理解它 。 为什么要引入Copula函数? 当边缘分布(即每个随机变量 阅读全文
posted @ 2022-11-09 18:31 拓端tecdat 阅读(93) 评论(0) 推荐(0) 编辑
摘要:全文下载链接: http://tecdat.cn/?p=22482 在本文中,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 引言 本教程的目的是帮助你学习如何在R中开发一个BRT模型。 示例数据 有两套短鳍鳗的记录数据。一个用于模型训练(建 阅读全文
posted @ 2022-11-09 18:29 拓端tecdat 阅读(57) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=26147 本文使用的数据集记录了 1236 名新生婴儿的体重(查看文末了解数据获取方式),以及他们母亲的其他协变量 本研究的目的是测量吸烟对新生儿体重的影响。研究人员需要通过控制其他协变量(例如母亲的体重和身高)来隔离其影响。这可以通过使用多元回归 阅读全文
posted @ 2022-11-08 20:49 拓端tecdat 阅读(40) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=3795 Glmnet是一个通过惩罚最大似然关系拟合广义线性模型的软件包。正则化路径是针对正则化参数λ的值网格处的lasso或Elastic Net(弹性网络)惩罚值计算的 ( 点击文末“阅读原文”获取完整代码数据******** )。 该算法非常快 阅读全文
posted @ 2022-11-08 20:46 拓端tecdat 阅读(367) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=12310 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。 ▼ 为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫情有更多的了解。 相关视频 新闻对疫 阅读全文
posted @ 2022-11-08 20:43 拓端tecdat 阅读(110) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19118 本文分析将用于制定管理客户和供应商关系的策略准则 假设: 贵公司拥有用于生产和分销聚戊二酸的设施,聚戊二酸是一种用于多个行业的化合物。 制造和分销过程的投入包括各种石油产品和天然气。价格波动可能非常不稳定。 营运资金管理一直是一个挑战,最 阅读全文
posted @ 2022-11-08 19:46 拓端tecdat 阅读(274) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=12272 使用ARIMA模型,您可以使用序列过去的值预测时间序列(点击文末“阅读原文”获取完整代码数据)。 在本文中,我们从头开始构建了一个最佳ARIMA模型,并将其扩展到Seasonal ARIMA(SARIMA)和SARIMAX模型。 时间序列 阅读全文
posted @ 2022-11-07 17:31 拓端tecdat 阅读(825) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24334 像任何统计建模一样,贝叶斯建模可能需要为你的研究问题设计合适的模型,然后开发该模型,使其符合你的数据假设并运行(点击文末“阅读原文”获取完整代码数据)。 1. 了解 Stan 统计模型可以在R或其他统计语言的各种包中进行拟合。但有时你在概 阅读全文
posted @ 2022-11-07 17:30 拓端tecdat 阅读(131) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22596 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?(点击文末“阅读原文”获取完整代码数据) 研究大纲 介绍数据集和研究的目标 探索数据集 阅读全文
posted @ 2022-11-07 17:27 拓端tecdat 阅读(161) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=11583 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴(点击文末“阅读原文”获取完整代码数据)。 为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫 阅读全文
posted @ 2022-11-07 17:25 拓端tecdat 阅读(165) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=30051 原文出处:拓端数据部落公众号 蛋白质组学 •研究生物体产生的全部蛋白质。 • Foci:鉴定、结构测定、生物标志物、通路、表达。 基质辅助激光解吸飞行时间质谱(MALDI-TOF)法示例频谱 研究动机 只有相对较少的开源软件解决方案可用, 阅读全文
posted @ 2022-11-07 16:27 拓端tecdat 阅读(363) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6663 此示例中,神经网络用于使用2011年4月至2013年2月期间的数据预测公民办公室的电力消耗(点击文末“阅读原文”获取完整代码数据)。 每日数据是通过总计每天提供的15分钟间隔的消耗量来创建的。 LSTM简介 LSTM(或长短期记忆人工神经网 阅读全文
posted @ 2022-11-04 23:12 拓端tecdat 阅读(408) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=18700 本文说明了R语言中实现分布滞后线性和非线性模型(DLM和DLNM)的建模。首先,本文描述了除时间序列数据之外的DLM / DLNM的一般化方法,在Gasparrini [2014]中有更详细的描述。 前言 本文中包含的结果并不代表科学 阅读全文
posted @ 2022-11-04 23:11 拓端tecdat 阅读(319) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=18149 无人驾驶汽车最早可以追溯到1989年。神经网络已经存在很长时间了,那么近年来引发人工智能和深度学习热潮的原因是什么呢?(点击文末“阅读原文”获取完整代码数据) 答案部分在于摩尔定律以及硬件和计算能力的显著提高。我们现在可以事半功倍。顾名思 阅读全文
posted @ 2022-11-04 23:10 拓端tecdat 阅读(184) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22596 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?(点击文末“阅读原文”获取完整代码数据) 研究大纲 介绍数据集和研究的目标 探索数据集 阅读全文
posted @ 2022-11-04 23:08 拓端tecdat 阅读(149) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=19129 在本文中,在学术界和金融界,分析高频财务数据的经济价值现在显而易见。(点击文末“阅读原文”获取完整代码数据) 摘要 它是每日风险监控和预测的基础,也是高频交易的基础。为了在财务决策中高效利用高频数据,高频时代采用了最先进的技术,用于清洗和 阅读全文
posted @ 2022-11-04 23:06 拓端tecdat 阅读(190) 评论(0) 推荐(0) 编辑
摘要:阅读全文:http://tecdat.cn/?p=24198 《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境。在本项目中,我将使用世界幸福报告中的数据来探索亚洲22个国家或地区,并通过查看每个 阅读全文
posted @ 2022-11-03 22:42 拓端tecdat 阅读(144) 评论(0) 推荐(0) 编辑
摘要:下载全文:http://tecdat.cn/?p=22302 在混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合(点击文末“阅读原文”获取完整代码数据)。 混合效应逻辑回归的例子 例1:一个研究人员对40所不同大学的申 阅读全文
posted @ 2022-11-03 22:41 拓端tecdat 阅读(300) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=29480 作者:Xingsheng Yang 1 利用 python 爬取链家网公开的租房数据; 2 对租房信息进行分析,主要对房租相关特征进行分析,并搭建模型用于预测房租(点击文末“阅读原文”获取完整代码数据)。 任务/目标 利用上海链家网站 阅读全文
posted @ 2022-11-03 22:35 拓端tecdat 阅读(110) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=22262 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)(点击文末“阅读原文”获取完整代码数据)。 但在实际生活中,有更多的观察值,更多的解释变量。随着两个以上的解释变量,它开始变得更加复杂的可视化。 相关视频 拓端 ,赞9 拓端 , 阅读全文
posted @ 2022-11-03 22:33 拓端tecdat 阅读(136) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19211 本文用matlab分析疫情数据集(点击文末“阅读原文”获取完整代码数据)。 数据源 我们检查解压缩的文件。包含: confirmed.csv-确诊病例的时间序列数据 deaths.csv-死亡人数的时间序列数据 recovered.csv 阅读全文
posted @ 2022-11-03 22:32 拓端tecdat 阅读(465) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=18149 无人驾驶汽车最早可以追溯到1989年。神经网络已经存在很长时间了,那么近年来引发人工智能和深度学习热潮的原因是什么呢?(点击文末“阅读原文”获取完整代码数据) 答案部分在于摩尔定律以及硬件和计算能力的显著提高。我们现在可以事半功倍。顾名思 阅读全文
posted @ 2022-11-02 16:24 拓端tecdat 阅读(188) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=2655 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性(点击文末“阅读原文”获取完整代码数据)。 当存在大量预测变量时,PLSR和PCR都是对因变量建模的方法,并且这些预测变量高度相关或 阅读全文
posted @ 2022-11-02 16:22 拓端tecdat 阅读(358) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=24346 在今天产品高度同质化的品牌营销阶段,企业与企业之间的竞争集中地体现在对客户的争夺上(点击文末“阅读原文”获取完整代码数据)。 “用户就是上帝”促使众多的企业不惜代价去争夺尽可能多的客户。但是企业在不惜代价发展新用户的过程中,往往会忽视或无 阅读全文
posted @ 2022-11-02 16:20 拓端tecdat 阅读(277) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=29841 最近我们被客户要求撰写关于非参数估计的研究报告。在应用的设置中,我们经常遇到分类数据类型和连续数据类型的组合(点击文末“阅读原文”获取完整代码数据)。 熟悉传统非参数核平滑方法的人会明白,这些方法假定基础数据本质上是连续的,但事实往往并非 阅读全文
posted @ 2022-11-02 16:18 拓端tecdat 阅读(176) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=23000 本文包含各种过滤器,可用于分解南非GDP的方法。我们做的第一件事是清除当前环境中的所有变量。这可以通过以下命令进行(点击文末“阅读原文”获取完整代码数据)。 分解南非GDP数据 本文包含各种过滤器,可用于分解南非GDP的方法。我们做的第一 阅读全文
posted @ 2022-11-01 17:13 拓端tecdat 阅读(172) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=14997 在文本挖掘中,我们经常有文档集合,例如博客文章或新闻文章,我们希望将它们分成自然组,以便我们理解它们(点击文末“阅读原文”获取完整代码数据)。 主题建模是一种对此类文档进行分类的方法。在本视频中,我们介绍了潜在狄利克雷分配LDA模型, 阅读全文
posted @ 2022-11-01 17:10 拓端tecdat 阅读(115) 评论(0) 推荐(0) 编辑
摘要:全文链接:http://tecdat.cn/?p=6763 NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。我们可以使用这些数据集的元数据来理解它们之间的联系(点击文末“阅读原文”获取完整代码数据)。 1 NASA如何组织数据 首 阅读全文
posted @ 2022-11-01 17:08 拓端tecdat 阅读(110) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=7207 在本文中,我想向您展示如何应用S&P500股票市场指数的交易策略(点击文末“阅读原文”获取完整代码数据)。 通过组合ARIMA和GARCH模型,从长期来看,我们可以超过“买入并持有”方法。 策略概述 该策略在“滚动”预测的基础上执行: 对于 阅读全文
posted @ 2022-11-01 17:05 拓端tecdat 阅读(115) 评论(0) 推荐(0) 编辑
摘要:全文下载链接:http://tecdat.cn/?p=19469 本文将分析工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和(点击文末“阅读原文”获取完整代码数据)。 时间序列分析模型 ARIMA-A 阅读全文
posted @ 2022-11-01 17:02 拓端tecdat 阅读(152) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示