07 2018 档案

摘要:通常,我们倾向于在构建模型时忽略异常值,这不是一个明智的做法, 异常值使数据偏移并降低准确性,在此让我们进一步了解异常处理。 什么样的值是异常值? 异常值是分析师和数据科学家常用的术语,因为它需要密切注意,否则可能导致错误的估计。 简单来说,异常值是一个观察值,远远超出了样本中的整体模式。 我们举个 阅读全文
posted @ 2018-07-27 14:49 拓端tecdat 阅读(5604) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5648 高光谱遥感能够实现冠层生化特性的大规模绘图。本研究探讨了从印度尼西亚Berau三角洲的红树林中回收氮,磷,钾,钙,镁和钠浓度的可能性。 该研究的目的是(1)评估叶面化学检索的准确性,(2)比较基于支持向量回归(SVR)的模型的性能,即ε-S 阅读全文
posted @ 2018-07-27 14:04 拓端tecdat 阅读(524) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2841 此示例显示MATLAB如何从复合条件均值和方差模型预测 和条件差异。 步骤1加载数据并拟合模型 加载工具箱附带的纳斯达克数据。将条件均值和方差模型拟合到数据中。 nasdaq = DataTable.NASDAQ; r = price2re 阅读全文
posted @ 2018-07-26 18:20 拓端tecdat 阅读(1634) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=3889 此示例显示如何使用估计复合条件均值和方差模型estimate。 加载数据并指定模型。 加载工具箱附带的NASDAQ数据 。对于数值稳定性,将返回值转换为收益率。指定AR(1)和GARCH(1,1)复合模型。 一个独立 相同分布的标准化高斯过 阅读全文
posted @ 2018-07-26 17:58 拓端tecdat 阅读(2311) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5361 多变量广义自回归条件异方差(MGARCH)和多变量随机波动率(MSV)模型与马尔可夫链蒙特卡罗方法的贝叶斯估计和比较可以直接和成功地在WinBUGS包中进行。 经济全球化和金融市场的完整性促进了对资产定价,风险管理,投资组合选择等各个领域的 阅读全文
posted @ 2018-07-26 16:36 拓端tecdat 阅读(881) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5312​​​​​​​ 在本文中,我们通过一个名为WinBUGS的免费贝叶斯软件,可以很容易地完成基于似然的多变量随机波动率(SV)模型的估计和比较。通过拟合每周汇率的双变量时间序列数据,九个多变量SV模型,包括波动率中的格兰杰因果关系,时变相关性, 阅读全文
posted @ 2018-07-26 16:35 拓端tecdat 阅读(552) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5312 在本文中,我们通过一个名为WinBUGS的免费贝叶斯软件,可以很容易地完成基于似然的多变量随机波动率(SV)模型的估计和比较。通过拟合每周汇率的双变量时间序列数据,多变量SV模型,包括波动率中的格兰杰因果关系,时变相关性,重尾误差分布,加性 阅读全文
posted @ 2018-07-26 16:20 拓端tecdat 阅读(460) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=4321 功能富集泡泡图 功能富集分析用来展示某一组基因(一般是单个样品上调或下调的基因)倾向参与哪些功能调控通路,对从整体理解变化了的基因的功能和潜在的调控意义具有指导作用,也是文章发表中一个有意义的美图。通常会用柱状图、泡泡图和热图进行展示。热图 阅读全文
posted @ 2018-07-26 15:18 拓端tecdat 阅读(639) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=4764 介绍 芯片数据分析流程有些复杂,但使用 R 和 Bioconductor 包进行分析就简单多了。本教程将一步一步的展示如何安装 R 和 Bioconductor,通过 GEO 数据库下载芯片数据, 对数据进行标准化,然后对数据进行质控检查, 阅读全文
posted @ 2018-07-26 15:00 拓端tecdat 阅读(2324) 评论(0) 推荐(0) 编辑
摘要:1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企业平台完全不同的新兴架构迅速地崛起。而下层技术基础的革命必将影响上层建筑:数据模型和算法。简单地将传统基于第四范式结构化关系型数据库的模型拷贝到新的引擎上,无异于削足适履,不仅增加了大数据应用开发的难度和复杂度,又无法发释放 阅读全文
posted @ 2018-07-25 13:48 拓端tecdat 阅读(1682) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=2723 所述配对双样品的Wilcoxon检验一种的非参数检验,其可以被用于比较样品的两个独立数据。 本文介绍如何在ř中计算两个样本的秩检验。 可视化数据并在ř中计算的Wilcoxon测试 ř函数用于计算的秩检验 为了执行两个样本的Wilcoxon检 阅读全文
posted @ 2018-07-24 18:23 拓端tecdat 阅读(848) 评论(0) 推荐(0) 编辑
摘要:如果两个数据样本来自不同的群体并且样本不相互影响,则它们是独立的。使用Mann-Whitney-Wilcoxon检验,我们可以确定种群分布是否相同而不假设它们遵循正态分布。 例 在数据集mtcars的数据框列 mpg中,有各种1974美国汽车的汽油里程数据。 > mtcars $ mpg [1] 2 阅读全文
posted @ 2018-07-24 18:22 拓端tecdat 阅读(760) 评论(0) 推荐(0) 编辑
摘要:原文链接 安装所需的包 wants <- c("coin") has <- wants %in% rownames(installed.packages()) if(any(!has)) install.packages(wants[!has])> 一个样本 测试 set.seed(123) med 阅读全文
posted @ 2018-07-24 18:21 拓端tecdat 阅读(1978) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5506 给直方图和线图添加误差棒 准备数据 这里使用ToothGrowth 数据集。它描述了维他命C对Guinea猪牙齿的生长影响。包含了三种不同的剂量(Vitamin C (0.5, 1, and 2 mg))和相应的两种不同使用方法( [ora 阅读全文
posted @ 2018-07-24 14:15 拓端tecdat 阅读(2871) 评论(0) 推荐(0) 编辑
摘要:摘要:本文作者利用自己过去三个月里所学到的东西,来预测所在城市的房价。所用到的技术有网络爬取技术、文本自然语言处理,图像上的深度学习模型以及梯度增强技术等。 对于我在梅蒂斯的最后一个项目,我希望能包含过去三个月里所学到的东西,而预测波特兰房价这个题目正符合我的要求,因为我能够将网络爬取技术、文本自然 阅读全文
posted @ 2018-07-24 14:12 拓端tecdat 阅读(931) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=5179 在我们开始之前,让我们更好地了解当您运行PROC SGPLOT以及BY语句和SG注释数据集时会发生什么。这个例子为每个通过Sex运行PROC SGPLOT生成的图形添加了一个注释,单词“Students”。 proc sort data=s 阅读全文
posted @ 2018-07-16 15:41 拓端tecdat 阅读(1766) 评论(0) 推荐(0) 编辑
摘要:电子表格不是数据库。但是,我们中的许多人使用电子表格就好像它们是数据库一样,然后当电子表格布局不支持数据库样式严格的可预测行,列和变量类型时,我们就会挣扎 - 这是分析和报告所需的基本元素。如果您使用SAS从Microsoft Excel读取数据,当您需要的数据不是从单元格A1开始时,您可以做什么? 阅读全文
posted @ 2018-07-16 15:22 拓端tecdat 阅读(811) 评论(0) 推荐(0) 编辑
摘要:通过SAS网络分析对人口迁移进行可视化分析 阅读全文
posted @ 2018-07-16 15:10 拓端tecdat 阅读(353) 评论(0) 推荐(0) 编辑
摘要:随着今晚和明天即将举行的几场大型比赛,我们与我们的合作伙伴SciSports合作,分析其余四支球队的优势。以下是法国队和比利时队的分析。 目前正在通过锦标赛分析为Red Devils提供支持。对于此特定报告,SciSports将其SciSkill数据提供我们,以便我们在SAS Visual Anal 阅读全文
posted @ 2018-07-16 14:57 拓端tecdat 阅读(176) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=6181 Word Mover的距离(WMD)是用于衡量两个文档之间差异的距离度量,它在文本分析中的应用是由华盛顿大学的一个研究小组在2015年引入的。 Word Mover距离的定义 WMD是两个文档之间的距离,作为将所有单词从一个文档移动到另一个 阅读全文
posted @ 2018-07-16 14:18 拓端tecdat 阅读(500) 评论(0) 推荐(0) 编辑
摘要:摘要:自然语言理解是人工智能的核心难题之一,也是目前智能语音交互和人机对话的核心难题。之前写过一篇文章自然语言理解,介绍了当时NLU的系统方案,感兴趣的可以再翻一番,里面介绍过的一些内容不再赘述。本文详细讨论了自然语言理解的难点,并进一步针对自然语言理解的两个核心问题,详细介绍了规则方法和深度学习的 阅读全文
posted @ 2018-07-11 15:06 拓端tecdat 阅读(493) 评论(0) 推荐(0) 编辑
摘要:Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。 阅读全文
posted @ 2018-07-11 15:04 拓端tecdat 阅读(780) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=3050 我一直在寻找各种方法来查找有关R包的信息,但我最近才了解CRAN_package_db()了基本tools包中的函数。如果一位同事没有向我指出,我确信我永远不会自己找到它。 当被调用时,这个函数发送到由环境变量指定的CRAN镜像,R_CRA 阅读全文
posted @ 2018-07-10 16:11 拓端tecdat 阅读(444) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://tecdat.cn/?p=4740 缺少数据在分析数据集时可能不是一个微不足道的问题。 如果缺失数据的量相对于数据集的大小非常小,那么为了不偏离分析而忽略缺少特征的少数样本可能是最好的策略,但是留下可用的数据点会剥夺某些数据的特征。 尽管某些快速修正如均值替代在某些情况下可能 阅读全文
posted @ 2018-07-10 14:12 拓端tecdat 阅读(435) 评论(0) 推荐(0) 编辑
摘要:其实,虽然很想做数据分析师,但是是跨行,心里相当忐忑,做这个分析就相当于加深自己对数据分析这个行业的了解了。 阅读全文
posted @ 2018-07-10 14:00 拓端tecdat 阅读(295) 评论(0) 推荐(0) 编辑
摘要:这篇文章是如何使用几种不同的矩阵分解算法计算相关艺术家的分步指南。代码用Python编写,使用 Pandas 和SciPy进行计算,D3.js以交互方式可视化结果。 阅读全文
posted @ 2018-07-09 16:45 拓端tecdat 阅读(320) 评论(0) 推荐(0) 编辑
摘要:微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户行为里有哪些值得深挖的奥秘吧! 阅读全文
posted @ 2018-07-09 16:43 拓端tecdat 阅读(134) 评论(0) 推荐(0) 编辑
摘要:论坛为有相同爱好的网友提供了广阔的互动交流平台,而由此积累下来的庞大数据和复杂的用户互动场景也蕴含着有价值的信息,本文对虎扑论坛的帖子、个人信息展开分析,探索虎扑论坛用户有哪些特点? 阅读全文
posted @ 2018-07-09 16:43 拓端tecdat 阅读(409) 评论(0) 推荐(0) 编辑
摘要:随着暑期档热映,最新电影成为广大影迷的热门话题,同时也是大IP能有出彩表现的最佳竞技场。本文对近十年来豆瓣热门影视作品数据进行盘点,一起来看看影视数据有哪些值得深挖的奥秘吧! 阅读全文
posted @ 2018-07-09 16:42 拓端tecdat 阅读(267) 评论(0) 推荐(0) 编辑
摘要:互联网无疑是当今最热门的行业。这个行业高薪资的背后也是大量的加班和激烈的竞争。择业不能只看薪水,适合自己才是最重要的。互联网公司都需要哪些人才?哪些职位更抢手?!本文对近年来互联网职位数据进行盘点,一起来看看职位数据有哪些值得深挖的奥秘吧! 阅读全文
posted @ 2018-07-09 16:41 拓端tecdat 阅读(213) 评论(0) 推荐(0) 编辑
摘要:这篇文章本来是要写进我上一篇关于Polynomial regression实现的文章里的,但一方面由于这个给散点图里添加拟合曲线和公式偏向画图,里面细节较多,相对上一节内容独立;另一方面,为了使篇幅不致过长,读者看起来辛苦,所以就分开成两篇文章。本篇衔接上一篇,所以数据以及模型都是跟上一篇里一样的, 阅读全文
posted @ 2018-07-09 16:39 拓端tecdat 阅读(7405) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示