代码改变世界

KNN算法——分类部分

2019-06-29 16:06 by ssswy, 1537 阅读, 0 推荐, 收藏, 编辑
摘要:1.核心思想 如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。也就是说找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性。 下面看一个例子, 一个程序员面试结束后,想想知道是否拿到offer, 阅读全文

数据仓库四个特点(面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant))

2018-05-13 22:28 by ssswy, 6967 阅读, 0 推荐, 收藏, 编辑
摘要:1、面向主题。 数据仓库中的数据是按照一定的主题域进行组织。 主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。而操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离。 2、集成的。 数据仓库中的数据是在对原有分散的数据库数据抽取 阅读全文

数据仓库组成

2018-05-13 22:19 by ssswy, 1642 阅读, 0 推荐, 收藏, 编辑
摘要:数据库 整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。相对于操纵型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。 数据抽取工具 把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。 对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成 阅读全文

数据仓库系统 体系结构

2018-05-13 22:15 by ssswy, 3086 阅读, 0 推荐, 收藏, 编辑
摘要:数据源: 数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于关系型数据库RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等;目前,我们的数据仓库的数据源主要是内部信息,也就是来源于各个信息系统下的关系型数据库 阅读全文

数据仓库与数据库的区别

2018-05-13 22:05 by ssswy, 2062 阅读, 0 推荐, 收藏, 编辑
摘要:数据库 数据仓库 面向 面向事务 面向主题设计 存储数据 存储在线交易数据 存储历史数据 规则设计 尽量避免冗余,一般采用符合范式的规则来设计 有意引入冗余,采用反范式的方式来设计 数据设计 捕获数据 分析数据 阅读全文

ETL技巧应用(高级应用介绍:准备区运用、 时间戳的运用、日志表的运用、使用调度)

2018-05-13 22:00 by ssswy, 525 阅读, 0 推荐, 收藏, 编辑
摘要:1.1 准备区运用 a.在构建数据仓库时,数据源位于一服务器上,数据仓库在另一服务器端,数据源Server端访问频繁,并且数据量大,需要不断更新, b.建立准备区数据库: >将数据抽取到准备区中, >基于准备区中的数据进行处理, 这样处理的好处是防止了在原OLTP系统中中频繁访问,进行数据运算或排序 阅读全文

ODS设计

2018-05-13 21:42 by ssswy, 441 阅读, 0 推荐, 收藏, 编辑
摘要:1.数据调研 2.确定数据范围 需要把上端应用需求与ODS数据范围进行验证,以确保应用所需的数据都已经从业务系统中抽取出来,并且得到了很好的组织,以ER模型表示数据主题关系 3.根据数据范围进行进一步的数据分析和主题定义 把第一步生成的每个ER图中的实体进行分解,分解的结果仍以ER表示为佳 4.定义 阅读全文

几种模型文件(CDM、LDM、PDM、OOM、BPM)

2018-05-13 18:01 by ssswy, 8684 阅读, 0 推荐, 收藏, 编辑
摘要:概念数据模型 (CDM): 帮助你分析信息系统的概念结构,识别主要实体、实体的属性及实体之间的联系。概念数据模型(CDM)比逻辑数据模型 (LDM)和物理数据模型(PDM)抽象。CDM 表现数据库的全部逻辑的结构,与任何的软件或数据存储结构无关。一个概念模型经常包括在物理数据库中仍然不实现的数据对象 阅读全文

mySQL 约束 (Constraints):一、非空约束 NOT NULL 约束

2018-05-06 12:39 by ssswy, 7974 阅读, 1 推荐, 收藏, 编辑
摘要:非空约束 NOT NULL 约束: 强制列不能为 NULL 值,约束强制字段始终包含值。这意味着,如果不向字段添加值,就无法插入新记录或者更新记录。 1.在 "Persons" 表创建时在 Id列、name列创建 not null 约束: create table Persons(id int no 阅读全文

mySQL 约束 (Constraints)

2018-05-06 12:07 by ssswy, 462 阅读, 0 推荐, 收藏, 编辑
摘要:约束用于限制加入表的数据的类型: 1.创建表时规定约束(通过 CREATE TABLE 语句) 2.表创建之后也可以(通过 ALTER TABLE 语句)。 约束类型: NOT NULL(非空) UNIQUE(唯一) PRIMARY KEY(主键) FOREIGN KEY(外键) CHECK(检查) 阅读全文