01 2021 档案

摘要:原文链接:http://tecdat.cn/?p=19095 本文对R中的文本内容进行情感分析。此实现利用了各种现有的字典,此外,还可以创建自定义词典。自定义词典使用LASSO正则化作为一种​​统计方法来选择相关词语。最后,评估比较所有方法。 介绍 情感分析是自然语言处理(NLP),计算语言学和文本 阅读全文
posted @ 2021-01-22 20:09 拓端tecdat 阅读(638) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19118 本文分析将用于制定管理客户和供应商关系的策略准则。假设: 贵公司拥有用于生产和分销聚戊二酸的设施,聚戊二酸是一种用于多个行业的化合物。 制造和分销过程的投入包括各种石油产品和天然气。价格波动可能非常不稳定。 营运资金管理一直是一个挑战,最 阅读全文
posted @ 2021-01-22 19:43 拓端tecdat 阅读(578) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19211 随着新型冠状病毒COVID-19的威胁遍及世界,我们生活在一个日益担忧的时代,本文用matlab分析COVID-19数据集。 COVID-19数据源 我们检查解压缩的文件。包含: data.csv -2020年各省/州的全球病例每日水平数 阅读全文
posted @ 2021-01-22 19:10 拓端tecdat 阅读(376) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19469 本文将分析工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和。 本文将尝试回答的主要问题是: 这些年来收益率和交易量如何变化? 这些年来,收 阅读全文
posted @ 2021-01-22 19:07 拓端tecdat 阅读(664) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19405 包含更多的预测变量不是免费的:在系数估算的更多可变性,更难的解释以及可能包含高度依赖的预测变量方面要付出代价。确实, 对于样本大小,在线性模型中可以考虑 的预测变量最大数量为 p 。或等效地,使用预测变量p 拟合模型需要最小样本量。 如果 阅读全文
posted @ 2021-01-22 19:06 拓端tecdat 阅读(286) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6763 NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。我们可以使用这些数据集的元数据来理解它们之间的联系。 1 NASA如何组织数据 首先,让我们下载JSON文件,并查看元数据 阅读全文
posted @ 2021-01-22 19:03 拓端tecdat 阅读(204) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19252 概要 有人已经表示有必要在战术资产配置(Tactical Asset Allocation, 简称TAA)策略中使用共同基金而不是ETF。不是使用半月更新(每月两次),而是每季度更新,因为许多平台不允许更频繁地交易共同基金。因此,我们着手 阅读全文
posted @ 2021-01-22 19:02 拓端tecdat 阅读(157) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19129 摘要 在学术界和金融界,分析高频财务数据的经济价值现在显而易见。它是每日风险监控和预测的基础,也是高频交易的基础。为了在财务决策中高效利用高频数据,高频时代采用了最先进的技术,用于清洗和匹配交易和报价,以及基于高收益的流动性的计算和预测。 阅读全文
posted @ 2021-01-22 18:57 拓端tecdat 阅读(437) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=12310 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。 ▼ 为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫情有更多的了解。 新闻对疫情相关主题 阅读全文
posted @ 2021-01-22 18:56 拓端tecdat 阅读(230) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19077 导入 自组织映射 (SOM)是一种工具,通过生成二维表示来可视化高维数据中的模式,在高维结构中显示有意义的模式。通过以下方式使用给定的数据(或数据样本)对SOM进行“训练”: 定义了网格的大小。 网格中的每个单元都在数据空间中分配了一个初 阅读全文
posted @ 2021-01-21 23:59 拓端tecdat 阅读(646) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19018 之前我们讨论了使用ROC曲线来描述分类器的优势,有人说它描述了“随机猜测类别的策略”,让我们回到ROC曲线来说明。考虑一个非常简单的数据集,其中包含10个观测值(不可线性分离) 在这里我们可以检查一下,确实是不可分离的 plot(x1,x 阅读全文
posted @ 2021-01-21 23:49 拓端tecdat 阅读(667) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=19006 最新研究表明,中国有超过7亿人在观看在线视频内容。Bilibili,被称为哔哩哔哩或简称为B站,是中国大陆第二个弹幕视频网站,最大的年轻人潮流文化娱乐社区,截至2020年3月31日的第一季度它已经拥有超过1.7亿的月度用户,反映了许多人认 阅读全文
posted @ 2021-01-21 23:47 拓端tecdat 阅读(173) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18993 在回归模型研究中,我们将讨论优化,而经典工具就是所谓的共轭。给定函数f:Rp→R,其共轭值为函数f ⋆:Rp→R使得 可视化考虑一个简单的抛物线函数(在维度1中)f(x)= x ^ 2 / 2,然后f ⋆(2)是线x↦2x与函数f(x)之 阅读全文
posted @ 2021-01-21 23:40 拓端tecdat 阅读(130) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18984 现在,分位数回归已被确立为重要的计量经济学工具。与均值回归(OLS)不同,目标不是给定x的均值,而是给定x的一些分位数。您可以使用它来查找具有良好上升潜力的股票。您可能会认为这与股票的beta有关,但是beta与OLS相关,并且是对称的。 阅读全文
posted @ 2021-01-21 23:39 拓端tecdat 阅读(145) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18970 在普遍的理解中,最大似然估计是使用已知的样本结果信息来反向推断最有可能导致这些样本结果的模型参数值! 换句话说,最大似然估计提供了一种在给定观测数据的情况下评估模型参数的方法,即“模型已确定且参数未知”。 在所有双射函数的意义上,极大似然 阅读全文
posted @ 2021-01-21 23:38 拓端tecdat 阅读(1051) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18944 本文将使用一个小数据说明ROC曲线,其中n = 10个观测值,两个连续变量x_1和x_2,以及二元变量y∈{0,1}。 我们可以表示平面(x_1,x_2)中的点,并且对y∈{0,1}中的y 使用不同的颜色。 df = data.frame 阅读全文
posted @ 2021-01-21 23:36 拓端tecdat 阅读(113) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18927 本文使用波兰公寓价格数据说明Fisher检验。 with(data = apart , boxplot(price ~ dis )) 我们在这里对公寓进行分组(这也可以通过简单的回归,这里5个解释变量并不重要)。我们可以重新排列 A = 阅读全文
posted @ 2021-01-21 23:35 拓端tecdat 阅读(161) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18879 这是一个六边形热图可视化程序,主要用到的知识RColorBrewer,fields,也就是R中的可视化绘图库。 本文希望SOM的结果以六边形热图可视化。让我向您展示如何在R中创建六边形热图! 您必须根据自组织神经网络(SOM)的结果来创建 阅读全文
posted @ 2021-01-02 21:57 拓端tecdat 阅读(278) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18770 为了用R来处理网络数据,我们使用婚礼数据集。 > nflo=network(flo,directed=FALSE) > plot(nflo, displaylabels = TRUE, + boxed.labels = + FALSE) 阅读全文
posted @ 2021-01-02 21:54 拓端tecdat 阅读(642) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18782 本文我们讨论了期望寿命的计算。人口统计模型的起点是死亡率表。但是,这种假设有偏差,因为它假设生活条件不会得到改善。为了正确处理问题,我们使用了更完整的数据,其中死亡人数根据x岁而定,还包括日期t。 DE=read.table("DE.tx 阅读全文
posted @ 2021-01-02 21:52 拓端tecdat 阅读(714) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18794 为了在统计过程中发现更多有趣的结果,我们将解决极大似然估计没有简单分析表达式的情况。举例来说,如果我们混合了各种分布, 作为说明,我们可以使用样例数据 > X=height 第一步是编写混合分布的对数似然函数 > logL=functio 阅读全文
posted @ 2021-01-02 21:50 拓端tecdat 阅读(423) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18726 自组织映射神经网络(SOM)是一种无监督的数据可视化技术,可用于可视化低维(通常为2维)表示形式的高维数据集。在本文中,我们研究了如何使用R创建用于客户细分的SOM。 SOM由1982年在芬兰的Teuvo Kohonen首次描述,而Koh 阅读全文
posted @ 2021-01-02 21:43 拓端tecdat 阅读(597) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5231 为了方便起见,这些模型通常简称为TAR模型。这些模型捕获了线性时间序列模型无法捕获的行为,例如周期,幅度相关的频率和跳跃现象。Tong和Lim(1980)使用阈值模型表明,该模型能够发现黑子数据出现的不对称周期性行为。 一阶TAR模型的示例 阅读全文
posted @ 2021-01-02 21:14 拓端tecdat 阅读(560) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18686 用于动量策略中所谓的动量(Momentum),是指某一对象所具有的一种倾向于保持其原有属性或特征的性质,也可以简单理解成一种惰性(Inertia)。股票的动量,简单地说就是涨的还会接着涨,跌的还会接着跌;过去涨得越猛,未来涨的也就越猛;过 阅读全文
posted @ 2021-01-02 21:10 拓端tecdat 阅读(151) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18700 前言 本文说明了R语言中实现分布滞后线性和非线性模型(DLM和DLNM)的建模。首先,本文描述了除时间序列数据之外的DLM / DLNM的一般化方法,在Gasparrini [2014]中有更详细的描述。本文中包含的结果并不代表科学发现, 阅读全文
posted @ 2021-01-02 21:08 拓端tecdat 阅读(1956) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=18661 在这篇文章中,我使用 R 建立著名的Hull-White利率模型并进行仿真。 Hull and White(1994)模型解决Vasicek模型对利率的初始期限结构的拟合不佳的问题。该模型定义为: Wt是风险中性框架下的维纳过程,模拟随机 阅读全文
posted @ 2021-01-02 21:05 拓端tecdat 阅读(222) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示