上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页
摘要: 一、前沿 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模... 阅读全文
posted @ 2014-11-12 17:15 Bobby0322 阅读(2890) 评论(0) 推荐(0) 编辑
摘要: 一、回归分析目的:设法找出变量间的依存(数量)关系, 用函数关系式表达出来。所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和... 阅读全文
posted @ 2014-11-12 16:57 Bobby0322 阅读(1713) 评论(1) 推荐(1) 编辑
摘要: Microsoft 决策树算法是由 Microsoft SQL Server Analysis Services 提供的分类和回归算法,用于对离散和连续属性进行预测性建模。对于离散属性,该算法根据数据集中输入列之间的关系进行预测。它使用这些列的值(也称之为状态)预测指定为可预测的列的状态。具体地说,... 阅读全文
posted @ 2014-11-11 15:15 Bobby0322 阅读(1460) 评论(0) 推荐(0) 编辑
摘要: 斐波那契数列指的是这样一个数列 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233,377,610,987,1597,2584,4181,6765,10946,17711,28657,46368斐波那契数列的发明者,是意大利数学家列昂纳多·斐波那契(L... 阅读全文
posted @ 2014-11-10 21:22 Bobby0322 阅读(2271) 评论(0) 推荐(1) 编辑
摘要: 临时表临时表与永久表相似,只是它的创建是在Tempdb中,它只有在一个数据库连接结束后或者由SQL命令DROP掉,才会消失,否则就会一直存在。临时表在创建的时候都会产生SQL Server的系统日志,虽它们在Tempdb中体现,是分配在内存中的,它们也支持物理的磁盘,但用户在指定的磁盘里看不到文件。... 阅读全文
posted @ 2014-11-08 20:02 Bobby0322 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 如:ROW_NUMBER、RANK、DENSE_RANK三个分析函数都是按照col1分组内从1开始排序 ROW_NUMBER() 是没有重复值的排序(即使两天记录相等也是不重复的),可以利用它来实现分页 DENSE_RANK() 是连续排序,两个第二名仍然跟着第三名RANK() ... 阅读全文
posted @ 2014-11-08 10:44 Bobby0322 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 聚合函数平均值AVG、标准偏差STDEV、方差VAR、最大值MAX、最小值MIN、合计SUM、次数COUNT、极差值MAX-MIN、变异系数STDEV/AVG*100什么是统计统计 就是通过样本特性推断总体特性的过程。类似于赌博,有一定的风险。可信度受取样方法、样本大小等因素的影响。统计是科学的为... 阅读全文
posted @ 2014-11-08 10:04 Bobby0322 阅读(2126) 评论(0) 推荐(0) 编辑
摘要: 在模糊查找中我们提到脏数据是怎样进入到表中的事情,主要还是由于一些“Lazy-add”造成的。这种情况我们的肉眼很容易被欺骗,看上去是同一个单词,其实就差那么一个字母,变成了两个不同的单词。一个简单的例子是X-Ray Tech和xRey,我们很有可能认为他们是同一个职务,CT操作员,但是如果让计算机... 阅读全文
posted @ 2014-11-08 09:15 Bobby0322 阅读(677) 评论(0) 推荐(0) 编辑
摘要: BI项目中经常会有一些提取,转换,数据处理(ELT)的工作,其中最主要的是处理过赃数据。假设在项目中我们向数据库中注入了测试数据,但是通过一个外键从另外一个表中载入数据的时候没有对应的数据,那么这一行就是赃数据。这时候可以使用SQL中的Sound-Ex,full-text,相似度算法等方法查找。这种... 阅读全文
posted @ 2014-11-07 16:30 Bobby0322 阅读(733) 评论(0) 推荐(0) 编辑
摘要: 查找转换通过联接输入列中的数据和引用数据集中的列来执行查找。是完全匹配查找。在源表中查找与字表能关联的所有源表记录。准备数据。源表 T_QualMoisture_Middle_Detail字典表 T_DIC_QualProcess数据流任务设计图:设计步骤: 阅读全文
posted @ 2014-11-07 12:52 Bobby0322 阅读(395) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页