06 2022 档案
摘要:相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat 作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生产实践,影响着每一位上进的开发者。 喜获“2022年度51CTO博主之星”的荣誉对拓端tecdat来
阅读全文
摘要:稀土掘金开发者社区公布了2021年度人气创作者榜单。拓端tecdat与华为云、蚂蚁金服、37手游等企业一同入选“2021 掘金人气团队榜榜单”。 近日互联网技术的优质内容分享社区稀土掘金,为了更好地展示社区的优质创作者、激励更多优质的技术人才参与到内容创作来,持续促进社区生态完善,评选了《2021
阅读全文
摘要:原文链接:http://tecdat.cn/?p=27050 原文出处:拓端数据部落公众号 随机森林是决策树的集合。在这篇文章中,我将向您展示如何从随机森林中可视化决策树。 视频:从决策树到随机森林:R语言信用卡违约分析信贷数据实例 从决策树到随机森林:R语言信用卡违约分析信贷数据实例 ,时长10:
阅读全文
摘要:原文链接:http://tecdat.cn/?p=27042 原文出处:拓端数据部落公众号 该数据根据世界各国提供的新病例数据提供。 获取时间序列数据 df=pd.read_csv("C://global.csv") 探索数据 此表中的数据以累积的形式呈现,为了找出每天的新病例,我们需要减去这些值
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26999 原文出处:拓端数据部落公众号 Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。 视频:R语言关联规则模型(Ap
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26988 原文出处:拓端数据部落公众号 豆瓣已经成为国内影迷和影评人的聚集地。 豆瓣评分已经成为评价中国电影的重要指标。 豆瓣积累了大量的电影数据,为电影行业分析提供了重要资源。 豆瓣电影被用来衡量国内外电影的发展。 中国与其他国家对比 汇总年电影
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26982 原文出处:拓端数据部落公众号 简介 客户流失/流失,是企业最重要的指标之一,因为获取新客户的成本通常高于保留现有客户的成本。 事实上,根据一个 study by Bain & Company,随着时间的推移,现有客户倾向于从公司购买更多
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22492 原文出处:拓端数据部落公众号 降维技术之一是主成分分析 (PCA) 算法,该算法将可能相关变量的一组观察值转换为一组线性不相关变量。在本文中,我们将讨论如何通过使用 R编程语言使用主成分分析来减少数据维度分析葡萄酒数据(查看文末了解数据获
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26932 原文出处:拓端数据部落公众号 在进行交叉验证之前,很自然地说“我会预烧 50%(比如说)我的数据来训练一个模型,然后用剩下的来拟合模型”。例如,我们可以使用训练数据进行变量选择(例如,在逻辑回归中使用一些逐步过程),然后,一旦选择了变量,
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26915 原文出处:拓端数据部落公众号 零膨胀泊松回归用于对超过零计数的计数数据进行建模。此外,理论表明,多余的零点是通过与计数值不同的过程生成的,并且可以独立地对多余的零点进行建模。因此, zip 模型有两个部分,泊松计数模型和用于预测多余零点的
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26897 原文出处:拓端数据部落公众号 视频:风险价值VaR原理与Python蒙特卡罗Monte Carlo模拟计算投资组合实例 风险价值VaR原理与Python蒙特卡罗Monte Carlo模拟计算投资组合实例 ,时长10:03 风险价值 (Va
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26868 原文出处:拓端数据部落公众号 在本教程中,我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。 视频:从决策树到随机森林:R语言信用卡违约分析信贷数据实例 从决策树到随机森林:R语言信用卡违约分析信贷数据实例 ,时长10
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22732 原文出处:拓端数据部落公众号 关联规则分析是一种揭示项目如何相互关联的技术。关联规则分析也称为购物篮分析。在这篇文章中,我将解释关联规则模型以及如何在R中提取关联规则。关联规则模型适用于交易数据(查看文末了解数据获取方式)。交易数据的一个
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26842 原文出处:拓端数据部落公众号 对于模拟股票价格,几何布朗运动 (GBM) 是 事实上的首选 模型。 它有一些很好的属性,通常与股票价格一致,例如对数正态分布(因此向下限制为零),并且期望收益不取决于价格的大小。 当然,GBM 只是一个模型
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26769 原文出处:拓端数据部落公众号 由于某大学学生人数过多,助教不足,因此有必要对期中考试给每个学生的题目数量施加五道题的限制。所有必须使用的问题必须来自大约 400 个预先批准的问题的测试库。 50% 的问题可以在期中使用。这项数据驱动研究的
阅读全文
摘要:相信技术,传递价值,这是51CTO每一个技术创作者的动力与信念,2022 年度,拓端tecdat (http://tecdat.cn)作为新锐的数据分析咨询公司,在51CTO平台上,不断的输出优质的技术文章,分享前沿创新技术,输出最佳生产实践,影响着每一位上进的开发者。 喜获“2022年度51CTO
阅读全文
摘要:稀土掘金开发者社区公布了2021年度人气创作者榜单。拓端tecdat与华为云、蚂蚁金服、37手游等企业一同入选“2021 掘金人气团队榜榜单”。 近日互联网技术的优质内容分享社区稀土掘金,为了更好地展示社区的优质创作者、激励更多优质的技术人才参与到内容创作来,持续促进社区生态完善,评选了《2021
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23305 原文出处:拓端数据部落公众号 什么是支持向量机 (SVM)? 我们将从简单的理解 SVM 开始。 【视频】支持向量机SVM、支持向量回归SVR和R语言网格搜索超参数优化实例 支持向量机SVM、支持向量回归SVR和R语言网格搜索超参数优化实
阅读全文
摘要:原文链接:http://tecdat.cn/?p=22862 原文出处:拓端数据部落公众号 什么是风险价值(VaR)? 风险价值 (VaR) 是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度。该指标最常被投资银行和商业银行用来确定其机构投资组合中潜在损失的程度和概率。 视
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26709 原文出处:拓端数据部落公众号 介绍 本文是在 R 中使用 Keras 的LSTM神经网络分类简单介绍。 软件包 library(tidyverse) #导入、清理、可视化 library(keras) # 用keras进行深度学习 lib
阅读全文
摘要:原文链接:http://tecdat.cn/?p=26678 原文出处:拓端数据部落公众号 在本笔记本中,我们向读者介绍了基本的随机波动率模型,并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。 第一个随机波动率模型 令 yt 为时
阅读全文
摘要:原文链接:http://tecdat.cn/?p=23344 原文出处:拓端数据部落公众号 本文中我们介绍了决策树和随机森林的概念,并在R语言中用逻辑回归、回归决策树、随机森林进行信用卡违约数据分析(查看文末了解数据获取方式)。 决策树是由节点和分支组成的简单树状结构。根据每个节点的任何输入特征拆分
阅读全文