摘要:
密钥分为对称密钥和非对称密钥,密钥本质上是加密数据的算法: 对称密钥(Symmetric Keys)是指加密和解密的过程使用相同的算法,是加密中最弱的算法,但是性能最好。对于对称密钥,可以使用密码或者另一个密钥甚至一个证书来加密。 非对称密钥(Asymmetric Keys)使用一对密钥(算法),一 阅读全文
摘要:
加密是通过使用密钥或密码来混淆数据的处理过程,把明文处理为密文,如果没有拿到相应的解密密钥或密码,即使拿到密文,也是无用,因此加密是保护数据的一个方法。用户只有拿到密钥和证书把密文数据解密之后,才能使用数据。如果没有密钥和证书,即使得到了数据,也无法得知数据的原始值,数据就没有价值了。由于数据的加密 阅读全文
摘要:
证书(Certificates)全称是公钥证书,是一种数字签名语句,它把公钥的值绑定到用户、设备或服务的ID上,这些用户、设备或服务ID拥有私钥,而私钥用于对数据进行解密。SQL Server中的证书同时包含公钥和密钥,前者用来加密,后者解密。为了保证私钥的安全,证书的私钥会被加密,可以使用数据库主 阅读全文
摘要:
作者:原上野 标题:大数据数据仓库建设链接:https://www.jianshu.com/p/83fa7b8c8e02来源:简书 一,数据仓库的数据模型 1. 数据源 数据源,顾名思义就是数据的来源,互联网公司的数据来源随着公司的规模扩张而呈递增趋势,同时自不同的业务源,比如埋点采集,客户上报等。 阅读全文
摘要:
多维数据分析是指按照多个维度(即多个角度)对数据进行观察和分析,多维的分析操作是指通过对多维形式组织起来的数据进行切片 、切块、聚合、钻取 、旋转等分析操作,以求剖析数据,使用户能够从多种维度、多个侧面 、多种数据综合度查看数据,从而深入地了解包含在数据中的信息和规律。 多维数据分析以数据仓库为基础 阅读全文
摘要:
转移组件分为:转移数据库组件和转移数据库对象组件,前者把整个数据库复制或移动到新的SQL Server实例中,后者把数据库中的对象转移到新的SQL Server数据库中。 一,Transfer Database Task 转移数据库任务用于在两个SQL Server实例之间转移数据库,可以拷贝或移动 阅读全文
摘要:
在SSIS的Execute SQL Task组件中执行存储过程,想要返回单行的结果,总是无法返回查询的结果,返回的错误是无法把DBNull转换为String类型: The type of the value (DBNull) being assigned to variable "User::Mai 阅读全文
摘要:
行上下文标识当前行,仅仅用于迭代,不会筛选任何数据,也不会自动利用关系。在当前的行上下文中,可以通过RELATED 和 RELATEDTABLE函数利用关系,以获取相关联表中得数据。行上下文存在于计算列或迭代函数中,没有其他方法可以创建行上下文,计算列和迭代函数会自动创建行上下文。 一,迭代函数执行 阅读全文
摘要:
有时会遇到令人费解的情况,平时一分钟可以完成的查询语句,某一天突然发生意外,运行了2-3个小时还在运行,这就是失控查询的行为表现,失控的查询(Runaway Query)是指实际执行时间比预计的时间要长的多,并且消耗大量的系统资源的查询。通常情况下,失控的查询是由关联表没有索引、关联表使用错误的索引 阅读全文
摘要:
SQL Server记录事务日志的目的,是为了把失败或取消的操作还原到最原始的状态,把数据还原到任意时间点。但是,并不是所有的操作都需要完全记录事务日志,比如,在一个空表上放置排他锁,把大量的数据插入到该空表中。即使插入操作在任意时刻失败,只需要把表清空,就可以把表还原到原始状态,根本不需要记录插入 阅读全文
摘要:
本文使用的环境是SQL Server 2017, 主机是64位操作系统。 大家都知道,Micorosoft Docs对 max参数的定义是:max 指定最大的存储空间是2GB,这个结论是正确的。 nvarchar [ ( n | max ) ]Variable-size string data. n 阅读全文
摘要:
在试验中,把考察的指标称为试验指标,影响试验指标的条件称为因素。因素可分为两类,一类是人为可控的测量数据,比如温度、身高等;一类是不可控的随机因素,例如,测量误差,气象条件等。因素所处的状态称为因素的水平。如果在试验过程中,只有一个因素在改变,称为单因素试验。方差分析(Analysis of Var 阅读全文
摘要:
原文是:The definitive guide to ALLSELECTED ALLSELECTED 可以返回一个表,也可以删除过滤器并恢复以前的过滤器上下文。 在这两种情况下,它都是通过使用迭代器在过滤器上下文堆栈上留下的最后一个影子过滤器上下文来实现的。 一,ALLSELECTED函数的用法 阅读全文
摘要:
ALLSELECTED 函数有两种用法:作为表函数,或者作为CALCULATE函数的筛选调节器,这两种功能都是通过使用迭代器在过滤器上下文堆栈上留下的最后一个影子过滤器上下文来实现的。ALLSELECTED 函数是DAX中唯一一个使用影子筛选上下文的函数。 使用影子筛选上下来定义ALLSELECTE 阅读全文
摘要:
数据分析的入门思维,首先要认识数据,然后对数据进行简单的分析,比如描述性统计分析和相关性分析等。 一,认识变量和数据 变量和数据是数据分析中常用的概念,用变量来描述事物的特征,而数据是变量的具体值,把变量的值也叫做观测值。 1,变量 变量是用来描述总体中成员的某一个特性,例如,性别、年龄、身高、收入 阅读全文
摘要:
同期群(Cohort)属于用户分群里的一个细分类型,是指在规定时间内对具有共同行为特征的用户进行分群。“共同行为特征”是指在某个时间段内的相似行为,它除了按不同时间的新增用户来分类外,还可以按不同的行为来分类,譬如“在2017年6月第一次购买”,“把5月1日~5月7日的注册用户划分为一个群组”等。 阅读全文
摘要:
一个漂亮的平均数完全是用数据创造出来的虚幻景象,会给我们的决策造成误导,因此我们需要掌握一个行之有效的方法来剖析真实的用户行为和用户价值,这个方法就是同期群分析(Cohort Analysis)。事实上,数据不会说谎,只是分析数据的人没有做到精准分析而导致对数据呈现的错误解读! 国内对同期群分析相关 阅读全文
摘要:
异常值在统计学上的全称是疑似异常值,也称作离群点(outlier),异常值的分析也称作离群点分析。异常值是指样本中出现的“极端值”,数据值看起来异常大或异常小,其分布明显偏离其余的观测值。异常值分析是检验数据中是否存在不合常理的数据,在数据分析中,既不能忽视异常值的存在,也不能简单地把异常值从数据分 阅读全文
摘要:
在运行以下Python代码时,Pandas抛出SettingWithCopyWarning警告: row_data = df_pred.loc[key] row_data['col'] = new_value df_pred是一个数据框,根据索引从数据框中获取一行,然后对该行的一个字段进行赋值,警告 阅读全文
摘要:
向量化和广播这两个概念是 numpy 内部实现的基础。有了向量化,编写代码时无需使用显式循环。广播(Broadcasting)机制描述了 numpy 如何在算术运算期间处理具有不同形状的数组,让较小的数组在较大的数组上“广播”,以便它们具有兼容的形状。两个形状相同的NumPy数组之间的操作是按元素操 阅读全文