摘要:
转载自:http://blog.sina.com.cn/s/blog_6c813dbd0101bh98.html 两个软硬程度一样但未知的鸡蛋,它们有可能都在一楼就摔碎,也可能从一百层楼摔下来没事。 有座100层的建筑,要你用这两个鸡蛋确定哪一层是鸡蛋可以安全落下的最高位置。可以摔碎两个鸡蛋。 最少 阅读全文
摘要:
一、脏数据处理 为什么要预处理数据? 数据缺失:记录为空&属性为空 数据重复:完全重复&不完全重复 数据错误:异常值&不一致 数据不可用:数据正确但不可用 如何预防脏数据? 制定数据标准 优化系统设计 1. 处理数据缺失: 忽略该记录 使用默认值 使用属性平均值 使用同类样本平均值 预测最可能的值 阅读全文
摘要:
数据仓库四个主要特征: 1.主题性 数据仓库是一般从用户实际需求出发,将不同平台的数据源按设定主题进行划分整合,与传统的面向事务的操作型数据库不同,具有较高的抽象性。面向主题的数据组织方式,就是在较高层次对分析对象数据的一个完整、统一并一致的描述,能完整及统一地刻画各个分析对象所涉及的有关企业的各项 阅读全文
摘要:
转载自:https://www.cnblogs.com/zhizhao/p/7825469.html (1)DELETE语句执行删除的过程是每次从表中删除一行,并且同时将该行的删除操作作为事务记录在日志中保存以便进行进行回滚操作。 TRUNCATE TABLE 则一次性地从表中删除所有的数据并不把单 阅读全文
摘要:
转载自:https://www.cnblogs.com/guoyaohua/p/8600214.html 0、排序算法说明 0.1 排序的定义 对一序列对象根据某个关键字进行排序。 0.2 术语说明 稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面; 不稳定:如果a原本在b的前面,而a= 阅读全文