02 2023 档案
摘要:原文链接:http://tecdat.cn/?p=7553 最近我们被客户要求撰写关于出租车GPS轨迹数据的研究报告,包括一些图形和统计输出。 通过解析原始数据 ,得到模式如下所示 数据 每次骑行都有非常具体的上/下车位置以及开始/结束时间的详细信息。 下面显示了一个示例 : 我们留下了158,32
阅读全文
摘要:原文参考:http://tecdat.cn/?p=4516 最近我们被客户要求撰写关于线性回归预测股票价格的研究报告,包括一些图形和统计输出。 线性回归在整个财务中广泛应用于众多应用程序中。在之前的教程中,我们使用普通最小二乘法(OLS)计算了公司的beta与相对索引的比较。现在,我们将使用线性回归
阅读全文
摘要:原文链接:http://tecdat.cn/?p=12292 最近我们被客户要求撰写关于HAR-RV的研究报告,包括一些图形和统计输出。 我们复制了Ghysels(2013)中提供的示例。我们进行了MIDAS回归分析,来预测季度GDP增长以及每月非农就业人数的增长 预测GDP增长 预测公式如下 其中
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22410 最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。 本文介绍了逻辑回归并在R语言中用逻辑回归(Logistic回归)模型分类预测病人冠心病风险数据 逻辑回归是机器学习借用的另一种统计分析方法。当我们的因变量是二分或二元
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31693 原文出处:拓端数据部落公众号 最近,有一种说法:“中国经济发展的命脉就是石油和航线”。因此,航线的重要性不言而喻。 近年来,中国的航运业发展迅速,不仅带来了经济效益和社会效益,也带来了就业岗位。因此,我们有必要分析航线分布状况。 为了更好
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31678 原文出处:拓端数据部落公众号 分析师:Ru Bai 网络购物模式已成为越来越重要的产品销售模式,亚马逊网站早在1995年就开始邀请产品消费者发表在线评论,此举带来了良好的效果,目前几乎所有的网站都采用了同样的方式。这是因为在线评论:与该网
阅读全文
摘要:全文下载链接: http://tecdat.cn/?p=22482 最近我们被客户要求撰写关于增强回归树(BRT)的研究报告,包括一些图形和统计输出。 在本文中,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 引言 本教程的目的是帮助你学习如
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22596 最近我们被客户要求撰写关于预测心脏病的研究报告,包括一些图形和统计输出。 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究? 研究大纲
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=27340 最近我们被客户要求撰写关于随机波动率SV、GARCH的研究报告,包括一些图形和统计输出。 波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR) 甚至波动
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=27515 最近我们被客户要求撰写关于重庆市经济指标的研究报告,包括一些图形和统计输出。 建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析,在借鉴了相关评价理论和评价方法的基础上,本文提取出经济规模、人均发展
阅读全文
摘要:报告链接:http://tecdat.cn/?p=31689 原文出处:拓端数据公众号 深度学习平台市场目前正经历着巨大的增长阶段。头部企业通过整合算力、研发、部署、行业应用等AI服务能力,布局硬件芯片、框架工具、研发平台、行业应用方向,实现全栈式深度学习平台体系。这样做的同时也提高了系统平台能力,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=2686 最近我们被客户要求撰写关于多项式回归的研究报告,包括一些图形和统计输出。 如果数据比简单的直线更为复杂,我们也可以用线性模型来拟合非线性数据 一个简单的方法就是将每一个特征的幂次方添加为一个新的特征,然后在这个拓展的特征集上进行线性拟合,这
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30131 最近我们被客户要求撰写关于空气质量指数的研究报告,包括一些图形和统计输出。 最近我们被客户要求撰写关于上海空气质量指数的研究报告。本文向大家介绍R语言对上海PM2.5等空气质量数据 间的相关分析和预测分析,主要内容包括其使用实例,具有一定
阅读全文
摘要:原文链接:http://tecdat.cn/?p=7553 最近我们被客户要求撰写关于出租车的研究报告,包括一些图形和统计输出。 通过解析原始数据 ,得到模式如下所示 数据 每次骑行都有非常具体的上/下车位置以及开始/结束时间的详细信息。 下面显示了一个示例 : 我们留下了158,320,608个出
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22838 最近我们被客户要求撰写关于鸢尾花iris数据集的研究报告,包括一些图形和统计输出。 本练习问题包括:使用R中的鸢尾花数据集 (a)部分:k-means聚类使用k-means聚类法将数据集聚成2组。画一个图来显示聚类的情况使用k-means
阅读全文
摘要:全文下载:http://tecdat.cn/?p=29461 最近我们被客户要求撰写关于水质数据的研究报告,包括一些图形和统计输出。 采样地点:淮河流域一带,昭平台水库、白龟山水库、燕山水库、石漫滩水库、板桥水库、宿鸭湖水库、博山水库、南湾水库、石山口水库、五岳水库、泼河水库、鲶鱼山水库 。 调查时
阅读全文
摘要:全文下载链接 :http://tecdat.cn/?p=27493 最近我们被客户要求撰写关于预测世界人口的研究报告,包括一些图形和统计输出。 本文应用R软件技术,分别利用logistic模型、ARFMA模型、ARIMA模型、时间序列模型对从2016到2100年的世界人口进行预测 作者将1950年到
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26897 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险 风险价值 (VaR) VaR 可以定义为资产在给定时间
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=20904 最近我们被客户要求撰写关于广义相加模型 (GAMs)的研究报告,包括一些图形和统计输出。 环境科学中的许多数据不适合简单的线性模型,最好用广义相加模型(GAM)来描述 这基本上就是具有 光滑函数的广义线性模型(GLM)的扩展 。当然,
阅读全文
摘要:阅读全文:http://tecdat.cn/?p=8522 最近我们被客户要求撰写关于神经网络的研究报告,包括一些图形和统计输出。 分类问题属于机器学习问题的类别,其中给定一组特征,任务是预测离散值。分类问题的一些常见示例是,预测肿瘤是否为癌症,或者学生是否可能通过考试 在本文中,鉴于银行客户的某些
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31664 原文出处:拓端数据部落公众号 随着天气预报技术的发展,数值预报产品日益丰富,预报方法多种多样。我们被客户要求撰写关于气象集成预报技术的研究报告,包括一些图形和统计输出。在实际应用中,对每个具体的问题,各种预报方法得出的结果通常是不一致的,
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30401 最近我们被客户要求撰写关于CPV模型的研究报告,包括一些图形和统计输出。 本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。我们被客户要求撰写关于CPV模型的研究报告 结果表明, 该模型在度量和预测房地产信贷违约率方面具有较好的
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=19469 最近我们被客户要求撰写关于ARMA-GARCH的研究报告,包括一些图形和统计输出。 本文将分析工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票
阅读全文
摘要:全文链接:http://tecdat.cn/?p=24141 最近我们被客户要求撰写关于贝叶斯线性回归的研究报告,包括一些图形和统计输出。 在本文中,贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。对社会经济因素如何影响收入和工资的研究为应用这些技术提供了充分的机会,同时也为从性别歧视到高等教育
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=3832 最近我们被客户要求撰写关于期货波动率的研究报告,包括一些图形和统计输出。 在本文中,波动率是众多定价和风险模型中的关键参数,例如BS定价方法或风险价值的计算。在这个模型中,或者说在教科书中,这些模型中的波动率通常被认为是一个常数 然而,
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31651 原文出处:拓端数据部落公众号 分析师:Xingming Xu 基于当前统计的股票数据选择最优的选股方案和投资组合方案,以及预测股票价格未来一段时间的走向趋势以及波动程度,具有很大的实用价值 我们需要完成以下问题 问题一:投资者购买目标指数
阅读全文
摘要:原文链接:http://tecdat.cn/?p=7303 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于社交网络的研究报告,包括一些图形和统计输出。 本示例使用Python和SAS分析了预防高危药物研究的结果。这个社交网络有194个节点和273个边,分别代表药物使用者和这些使用者之间的联
阅读全文
摘要:原文链接:http://tecdat.cn/?p=5453 最近我们被客户要求撰写关于特征选择方法的研究报告,包括一些图形和统计输出。 变量选择方法 所有可能的回归 model <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars) ols_all_sub
阅读全文
摘要:全文下载:http://tecdat.cn/?p=22319 最近我们被客户要求撰写关于偏最小二乘法(PLS)回归的研究报告,包括一些图形和统计输出。 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去
阅读全文
摘要:全文链接:http://tecdat.cn/?p=12272 最近我们被客户要求撰写关于ARIMA的研究报告,包括一些图形和统计输出。 使用ARIMA模型,您可以使用序列过去的值预测时间序列 在本文中,我们从头开始构建了一个最佳ARIMA模型,并将其扩展到Seasonal ARIMA(SARIMA)
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=29480 作者:Xingsheng Yang 最近我们被客户要求撰写关于链家租房的研究报告,包括一些图形和统计输出。 1 利用 python 爬取链家网公开的租房数据; 2 对租房信息进行分析,主要对房租相关特征进行分析,并搭建模型用于预测房租
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31644 原文出处:拓端数据部落公众号 借着二胎政策的开放与家庭消费升级的东风,母婴市场迎来了生机盎然的春天,尤其是母婴电商行业,近年来发展迅猛。用户获取和流失是一对相对概念,就好比一个水池,有进口,也有出口。我们不能只关心进口的进水速率,却忽略了
阅读全文
摘要:报告链接:http://tecdat.cn/?p=31578 原文出处:拓端数据部落公众号 在全球范围内,腹腔镜手术机器人最受欢迎,美国是其最大的市场。 全球最大的手术机器人市场在美国。根据弗罗斯特·沙利文( Frost Sullivan )的分析,2020年中国、欧洲和美国将分别占全球前三大手术机
阅读全文
摘要:报告链接:http://tecdat.cn/?p=31600 原文出处:拓端数据部落公众号 受产业政策、市场环境、消费者认知、产业技术等因素的驱动,近年来中国新能源汽车产业进入快速扩张阶段。据共享出行协会数据显示,2022年7月新能源汽车销量同比增长118.7 %,占全部汽车销量的26.4 %,同比
阅读全文
摘要:报告链接:http://tecdat.cn/?p=31493 原文出处:拓端数据公众号 互联网平台之间的竞争在整个"双十一"的发展过程中不断加剧,从传统电商平台无可争议的一家独大,到后起之秀如抖音、快手与"大哥大"如淘宝、京东之间的"激战"。 直播电商现已成为品牌营销的常态。直播电商为品牌提供了产品
阅读全文
摘要:报告链接:http://tecdat.cn/?p=31515 原文出处:拓端数据公众号 汽车和互联网技术产业的新生力量已经吹响了变革的号角,它们在争夺人心。传统汽车制造商也受益于这一趋势,获得了向用户提供车辆生命周期服务的额外机会,增加了他们挖掘汽车生命周期价值的能力,并通过软件订阅和按需服务建立了
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24875 最近我们被客户要求撰写关于支持向量回归SVR的研究报告,包括一些图形和统计输出。 支持向量回归(SVR)是一种回归算法,它应用支持向量机(SVM)的类似技术进行回归分析。正如我们所知,回归数据包含连续的实数 为了拟合这种类型的数据,SVR
阅读全文
摘要:原文链接:http://tecdat.cn/?p=17950 最近我们被客户要求撰写关于的研究报告,包括一些图形和统计输出。 在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能 数据集是 credit=read.csv("gecredit.csv", he
阅读全文
摘要:全文链接:http://tecdat.cn/?p=18149 最近我们被客户要求撰写关于CNN(卷积神经网络)的研究报告,包括一些图形和统计输出。 无人驾驶汽车最早可以追溯到1989年。神经网络已经存在很长时间了,那么近年来引发人工智能和深度学习热潮的原因是什么呢? 答案部分在于摩尔定律以及硬件和计
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22862 最近我们被客户要求撰写关于风险价值VaR的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度 什么是风险价值(VaR)? 该指标最常被投资银行和商业银行用
阅读全文
摘要:全文链接:tecdat.cn/?p=2155 最近我们被客户要求撰写关于NLP自然语言处理的研究报告,包括一些图形和统计输出。 随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的时代需求是分不开的
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30680 最近我们被客户要求撰写关于电影市场调查问卷数据的研究报告,包括一些图形和统计输出。 这是一份有关消费者对电影市场看法及建议的调查报告,我们采取了问卷调查法,其中发放问卷256份,回收有效问卷200份 我们对数据进行了基本分析,比如:相关性
阅读全文
摘要:阅读全文:http://tecdat.cn/?p=24354 最近我们被客户要求撰写关于分析声纳数据的研究报告,包括一些图形和统计输出。 在本文中,介绍简化模型构建和评估过程 caret包的train 函数可用于 使用重采样评估模型调整参数对性能的影响 在这些参数中选择“最佳”模型 从训练集估计模型
阅读全文
摘要:全文链接:http://tecdat.cn/?p=27078 最近我们被客户要求撰写关于时间序列进行聚类的研究报告,包括一些图形和统计输出。 时序数据的聚类方法,该算法按照以下流程执行。 使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列聚类的质心。(一种新的基于质心的聚
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=24535 最近我们被客户要求撰写关于COPULA的研究报告,包括一些图形和统计输出。 最近,copula 在仿真模型中变得流行起来。Copulas 是描述变量之间依赖关系的函数,并提供了一种创建分布以对相关多元数据建模的方法 使用 copula
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31630 原文出处:拓端数据部落公众号 普通的模型对于两个序列的波动分析一般是静态的,但是dcc-garch模型可以实现他们之间动态相关的波动分析,即序列间波动并非为一个常数,而是一个随着时间的变化而变化的系数。其主要用于研究市场间波动率的关系。
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26897 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险 风险价值 (VaR) VaR 可以定义为资产在给定时间
阅读全文
摘要:全文链接:http://tecdat.cn/?p=10809 最近我们被客户要求撰写关于分层线性模型HLM的研究报告,包括一些图形和统计输出。 本文用于比较六个不同统计软件程序(SAS,Stata,HLM,R,SPSS和Mplus)的两级分层线性模型的过程和输出 下面介绍的六个模型都是两级分层模型的
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23170 最近我们被客户要求撰写关于虚拟变量回归的研究报告,包括一些图形和统计输出。 在本文中,本文与以下两个问题有关。你应该如何添加虚拟变量?你应该如何解释结果 简介 如果使用一个例子,我们可能会更容易理解这些问题。 数据 假设我们想研究工资是如
阅读全文
摘要:全文链接:http://tecdat.cn/?p=18860 最近我们被客户要求撰写关于时间序列的研究报告,包括一些图形和统计输出。 时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息来预测序列的未来值 简介 时序分析有两种方法,即频域和时域。前者主要基
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31617 原文出处:拓端数据部落公众号 我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个适合他们需求的持向量机回归模型。 我们需要拟合支持向量机回归模型:进行网格搜索超参数优化并使用训练好的模型进行预测推理、使用plot函数可视化线图对比
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24334 最近我们被客户要求撰写关于贝叶斯线性回归的研究报告,包括一些图形和统计输出。 像任何统计建模一样,贝叶斯建模可能需要为你的研究问题设计合适的模型,然后开发该模型,使其符合你的数据假设并运行 1. 了解 Stan 统计模型可以在R或其他统计
阅读全文
摘要:全文链接 http://tecdat.cn/?p=23255 最近我们被客户要求撰写关于rstan的研究报告,包括一些图形和统计输出。 本文将谈论Stan以及如何在R中使用rstan创建Stan模型 尽管Stan提供了使用其编程语言的文档和带有例子的用户指南,但对于初学者来说,这可能是很难理解的。
阅读全文
摘要:全文链接:http://tecdat.cn/?p=18860 最近我们被客户要求撰写关于时间序列的研究报告,包括一些图形和统计输出。 时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息来预测序列的未来值 简介 时序分析有两种方法,即频域和时域。前者主要基
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=3832 最近我们被客户要求撰写关于期货波动率的研究报告,包括一些图形和统计输出 在本文中,波动率是众多定价和风险模型中的关键参数,例如BS定价方法或风险价值的计算。在这个模型中,或者说在教科书中,这些模型中的波动率通常被认为是一个常数 然而,情
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31585 原文出处:拓端数据部落公众号 Google Trends, 即谷歌趋势。谷歌趋势是谷歌旗下一款基于搜索数据推出的一款分析工具。它通过分析谷歌搜索引擎每天数十亿的搜索数据,告诉用户某一关键词或者话题各个时期下在谷歌搜索引擎中展示的频率及其相
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24814 最近我们被客户要求撰写关于配对交易策略的研究报告,包括一些图形和统计输出。 说到在股票市场上赚钱,有无数种不同的赚钱方式。似乎在金融界,无论你走到哪里,人们都在告诉你应该学习 Python 毕竟,Python 是一种流行的编程语言,可用于
阅读全文
摘要:全文链接:http://tecdat.cn/?p=27279 最近我们被客户要求撰写关于循环神经网络RNN的研究报告,包括一些图形和统计输出。 此示例说明如何使用长短期记忆 (LSTM) 网络预测时间序列 LSTM神经网络架构和原理及其在Python中的预测应用 LSTM 网络是一种循环神经网络 (
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23800 最近我们被客户要求撰写关于空气污染数据的研究报告,包括一些图形和统计输出。 由于空气污染对公众健康的不利影响,人们一直非常关注。世界各国的环境部门都通过各种方法(例如地面观测网络)来监测和评估空气污染问题 介绍 全球的地面站及时测量了许多
阅读全文
摘要:全文下载链接: http://tecdat.cn/?p=26105 最近我们被客户要求撰写关于LCTM的研究报告,包括一些图形和统计输出。 在本文中,潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。然而,对于给定的数据集,可以
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31585 原文出处:拓端数据部落公众号 Google Trends, 即谷歌趋势。谷歌趋势是谷歌旗下一款基于搜索数据推出的一款分析工具。它通过分析谷歌搜索引擎每天数十亿的搜索数据,告诉用户某一关键词或者话题各个时期下在谷歌搜索引擎中展示的频率及其相
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30914 最近我们被客户要求撰写关于广义线性模型的研究报告,包括一些图形和统计输出。 我们正和一位朋友讨论如何在R软件中用GLM模型处理全国的气候数据。本文获取了全国的2021年全国的气候数据 采样时间:2021年1月1号~2021年12月31号
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=29480 作者:Xingsheng Yang 最近我们被客户要求撰写关于链家租房数据的研究报告,包括一些图形和统计输出。 1 利用 python 爬取链家网公开的租房数据; 2 对租房信息进行分析,主要对房租相关特征进行分析,并搭建模型用于预测
阅读全文
摘要:全文链接: http://tecdat.cn/?p=2596 最近我们被客户要求撰写关于混合效应模型的研究报告,包括一些图形和统计输出。 在本文中,我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率 1.混合模型是否适合您的需求? 混合模型在很多方面与线性
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22458 最近我们被客户要求撰写关于动态模型平均的研究报告,包括一些图形和统计输出。 本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22262 最近我们被客户要求撰写关于心脏病数据的研究报告,包括一些图形和统计输出。 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量) 但在实际生活中,有更多的观察值,更多的解释变量。随着两个以上的解释变量,它开始变得更加复杂的可视化。
阅读全文
摘要:原文链接:http://tecdat.cn/?p=24973 最近我们被客户要求撰写关于心脏病的研究报告,包括一些图形和统计输出。 世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病 简介 心血管疾病的早期预后可以帮助决定改变高危患者的生活方式,
阅读全文
摘要:全文链接:http://tecdat.cn/?p=2655 最近我们被客户要求撰写关于偏最小二乘回归的研究报告,包括一些图形和统计输出。 此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性 当存在大量预测变量时,PLSR和PCR都是对因变量建
阅读全文
摘要:全文链接:http://tecdat.cn/?p=24141 最近我们被客户要求撰写关于贝叶斯的研究报告,包括一些图形和统计输出。 在本文中,贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。对社会经济因素如何影响收入和工资的研究为应用这些技术提供了充分的机会,同时也为从性别歧视到高等教育的好处等
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23170 最近我们被客户要求撰写关于回归的研究报告,包括一些图形和统计输出。 在本文中,本文与以下两个问题有关。你应该如何添加虚拟变量?你应该如何解释结果 ? 简介 如果使用一个例子,我们可能会更容易理解这些问题。 数据 假设我们想研究工资是如何由
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31563 原文出处:拓端数据部落公众号 以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据为依据, 利用SPSS和R统计软件
阅读全文
摘要:原文链接 :http://tecdat.cn/?p=3726 最近我们被客户要求撰写关于时间序列聚类的研究报告,包括一些图形和统计输出。 本文我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列 企业对企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的
阅读全文
摘要:全文链接:http://tecdat.cn/?p=27078 最近我们被客户要求撰写关于时间序列聚类的研究报告,包括一些图形和统计输出。 时序数据的聚类方法,该算法按照以下流程执行。 使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列聚类的质心。(一种新的基于质心的聚类算
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22862 最近我们被客户要求撰写关于风险价值VaR的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度 什么是风险价值(VaR)? 该指标最常被投资银行和商业银行用
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22410 最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。 本文介绍了逻辑回归并在R语言中用逻辑回归(Logistic回归)模型分类预测病人冠心病风险数据 逻辑回归是机器学习借用的另一种统计分析方法。当我们的因变量是二分或二元
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31556 原文出处:拓端数据部落公众号 传统的经济理论认为股票市场是有效的,价格波动是对市场信息的反应,投资者能够及时处理所有实时信息并做出最优决策。 交易策略基本思想 投资者的当期关注和股票当期收益呈现正向变动关系,而投资者的滞后关注对股票当期收
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23344 最近我们被客户要求撰写关于信用卡违约的研究报告,包括一些图形和统计输出。 本文中我们介绍了决策树和随机森林的概念,并在R语言中用逻辑回归、回归决策树、随机森林进行信用卡违约数据分析(查看文末了解数据获取方式) 决策树是由节点和分支组成的简
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=20631 最近我们被客户要求撰写关于混合效应模型的研究报告,包括一些图形和统计输出 我们已经学习了如何处理混合效应模型。本文的重点是如何建立和_可视化_ 混合效应模型的结果 设置 本文使用数据集,用于探索草食动物种群对珊瑚覆盖的影响。 knit
阅读全文
摘要:全文链接:http://tecdat.cn/?p=30360 最近我们被客户要求撰写关于网络购物的研究报告,包括一些图形和统计输出。 随着网络的迅速发展,依托于网络的购物作为一种新型的消费方式,在全国乃至全球范围内飞速发展 电子商务成为越来越多消费者购物的重要途径。我们被客户要求撰写关于网络购物行为
阅读全文
摘要:原文链接:http://tecdat.cn/?p=17549 最近我们被客户要求撰写关于马尔可夫链模型的研究报告,包括一些图形和统计输出。 本示例说明如何创建并可视化Markov链模型的结构和演化 。考虑从随机转移矩阵中创建马尔可夫链的四状态马尔可夫链,该模型模拟了国内生产总值(GDP)的动态 创建
阅读全文
摘要:全文链接:http://tecdat.cn/?p=16453 最近我们被客户要求撰写关于股票市场的研究报告,包括一些图形和统计输出。 金融市场上最重要的任务之一就是分析各种投资的历史收益 要执行此分析,我们需要资产的历史数据。数据提供者很多,有些是免费的,大多数是付费的。在本文中,我们将使用Yaho
阅读全文
摘要:原文链接:http://tecdat.cn/?p=11936 最近我们被客户要求撰写关于Nelson-Siegel的研究报告,包括一些图形和统计输出。 在本教程中,我们将研究如何将Nelson-Siegel-Svensson(NSS)模型拟合到数据 1引言 由于我们将使用随机技术进行优化,因此我们应
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23518 最近我们被客户要求撰写关于银行拉新活动的研究报告,包括一些图形和统计输出。 项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。银行拥有不断增长的客户 该银行希望增加借款人(资产客户),开展更多的
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23061 最近我们被客户要求撰写关于预测心脏病的研究报告,包括一些图形和统计输出。 这个数据集可以追溯到1988年,由四个数据库组成。克利夫兰、匈牙利、瑞士和长滩。"目标 "字段是指病人是否有心脏病。它的数值为整数,0=无病,1=有病 。 数据集信
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=29480 作者:Xingsheng Yang 最近我们被客户要求撰写关于租房数据的研究报告,包括一些图形和统计输出。 1 利用 python 爬取链家网公开的租房数据; 2 对租房信息进行分析,主要对房租相关特征进行分析,并搭建模型用于预测房租
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31544 原文出处:拓端数据部落公众号 在网络技术高速发展的背景下,信息纷乱繁杂,如何能够获得需要的文本信息,成了许多企业或组织关注的问题。 该项目以采集的豆瓣电影评论数据为例,使用R语言和神经网络算法,对文本挖掘进行全流程的分析,包括对其特征及其
阅读全文
摘要:全文链接:http://tecdat.cn/?p=11724 最近我们被客户要求撰写关于混合效应模型的研究报告,包括一些图形和统计输出。 文中本教程对多层_回归_模型进行了基本介绍 介绍 本教程期望: 多层_回归_模型的基础知识 。 R中编码的基础知识。 安装R软件包 lme4,和 lmerTest
阅读全文
摘要:全文下载:http://tecdat.cn/?p=22319 最近我们被客户要求撰写关于PLS的研究报告,包括一些图形和统计输出。 本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。为了建立一个可靠的模型,我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点和只使
阅读全文
摘要:全文下载链接: http://tecdat.cn/?p=22482 最近我们被客户要求撰写关于增强回归树的研究报告,包括一些图形和统计输出。 在本文中,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。 引言 本教程的目的是帮助你学习如何在R中开
阅读全文
摘要:全文链接:http://tecdat.cn/?p=22596 最近我们被客户要求撰写关于预测心脏病的研究报告,包括一些图形和统计输出。 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究? 研究大纲
阅读全文
摘要:全文链接:http://tecdat.cn/?p=31480 原文出处:拓端数据部落公众号 我国以前一直以来都是世界上大豆生产的第一大国。但由于各国的日益强大,导致我国豆种植面积和产量持续缩减。因此,预测我国的大豆产量对中国未来的经济发展有着极其重要的作用。 我们为一位客户进行了短暂的咨询工作,他正
阅读全文
摘要:原文链接:http://tecdat.cn/?p=6592 我们被要求在本周提供一个报告,该报告将结合pca, t-SNE算法等数值方法 降低维度有两个主要用例:数据探索和机器学习。它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本 然后可以使用这种可视化来从数据获得见解(例
阅读全文
摘要:全文下载链接:http://tecdat.cn/?p=12174 我们被要求在本周提供一个报告,该报告将结合ARMA-EGARCH,集成预测算法等数值方法 本文比较了几个时间序列模型,以预测SP500指数的每日实际波动率。基准是SPX日收益序列的ARMA-EGARCH模型。将其与GARCH模型进行比
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23170 我们被要求在本周提供一个报告,该报告将结合虚拟变量,回归等数值方法 在本文中,本文与以下两个问题有关。你应该如何添加虚拟变量?你应该如何解释结果 简介 如果使用一个例子,我们可能会更容易理解这些问题。 数据 假设我们想研究工资是如何由教育
阅读全文
摘要:全文链接:http://tecdat.cn/?p=24141 我们被要求在本周提供一个报告,该报告将结合贝叶斯线性回归,贝叶斯模型平均等数值方法。 在本文中,贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。对社会经济因素如何影响收入和工资的研究为应用这些技术提供了充分的机会,同时也为从性别歧视到
阅读全文
摘要:全文链接:http://tecdat.cn/?p=23170 我们被要求在本周提供一个报告,该报告将结合回归,虚拟变量等数值方法 在本文中,本文与以下两个问题有关。你应该如何添加虚拟变量?你应该如何解释结果 简介 如果使用一个例子,我们可能会更容易理解这些问题。 数据 假设我们想研究工资是如何由教育
阅读全文