摘要: 原文链接:http://tecdat.cn/?p=19095 本文对R中的文本内容进行情感分析。此实现利用了各种现有的字典,此外,还可以创建自定义词典。自定义词典使用LASSO正则化作为一种​​统计方法来选择相关词语。最后,评估比较所有方法。 介绍 情感分析是自然语言处理(NLP),计算语言学和文本 阅读全文
posted @ 2021-01-22 20:09 拓端tecdat 阅读(593) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19118 本文分析将用于制定管理客户和供应商关系的策略准则。假设: 贵公司拥有用于生产和分销聚戊二酸的设施,聚戊二酸是一种用于多个行业的化合物。 制造和分销过程的投入包括各种石油产品和天然气。价格波动可能非常不稳定。 营运资金管理一直是一个挑战,最 阅读全文
posted @ 2021-01-22 19:43 拓端tecdat 阅读(564) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19211 随着新型冠状病毒COVID-19的威胁遍及世界,我们生活在一个日益担忧的时代,本文用matlab分析COVID-19数据集。 COVID-19数据源 我们检查解压缩的文件。包含: data.csv -2020年各省/州的全球病例每日水平数 阅读全文
posted @ 2021-01-22 19:10 拓端tecdat 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19469 本文将分析工业指数(DJIA)。工业指数(DIJA)是一个股市指数,表明30家大型上市公司的价值。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和。 本文将尝试回答的主要问题是: 这些年来收益率和交易量如何变化? 这些年来,收 阅读全文
posted @ 2021-01-22 19:07 拓端tecdat 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19405 包含更多的预测变量不是免费的:在系数估算的更多可变性,更难的解释以及可能包含高度依赖的预测变量方面要付出代价。确实, 对于样本大小,在线性模型中可以考虑 的预测变量最大数量为 p 。或等效地,使用预测变量p 拟合模型需要最小样本量。 如果 阅读全文
posted @ 2021-01-22 19:06 拓端tecdat 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=6763 NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。我们可以使用这些数据集的元数据来理解它们之间的联系。 1 NASA如何组织数据 首先,让我们下载JSON文件,并查看元数据 阅读全文
posted @ 2021-01-22 19:03 拓端tecdat 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19252 概要 有人已经表示有必要在战术资产配置(Tactical Asset Allocation, 简称TAA)策略中使用共同基金而不是ETF。不是使用半月更新(每月两次),而是每季度更新,因为许多平台不允许更频繁地交易共同基金。因此,我们着手 阅读全文
posted @ 2021-01-22 19:02 拓端tecdat 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=19129 摘要 在学术界和金融界,分析高频财务数据的经济价值现在显而易见。它是每日风险监控和预测的基础,也是高频交易的基础。为了在财务决策中高效利用高频数据,高频时代采用了最先进的技术,用于清洗和匹配交易和报价,以及基于高收益的流动性的计算和预测。 阅读全文
posted @ 2021-01-22 18:57 拓端tecdat 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 原文链接:http://tecdat.cn/?p=12310 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。 ▼ 为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫情有更多的了解。 新闻对疫情相关主题 阅读全文
posted @ 2021-01-22 18:56 拓端tecdat 阅读(229) 评论(0) 推荐(0) 编辑