上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 28 下一页
摘要: 同期群(Cohort)属于用户分群里的一个细分类型,是指在规定时间内对具有共同行为特征的用户进行分群。“共同行为特征”是指在某个时间段内的相似行为,它除了按不同时间的新增用户来分类外,还可以按不同的行为来分类,譬如“在2017年6月第一次购买”,“把5月1日~5月7日的注册用户划分为一个群组”等。 阅读全文
posted @ 2019-12-31 15:53 悦光阴 阅读(3604) 评论(0) 推荐(2)
摘要: 一个漂亮的平均数完全是用数据创造出来的虚幻景象,会给我们的决策造成误导,因此我们需要掌握一个行之有效的方法来剖析真实的用户行为和用户价值,这个方法就是同期群分析(Cohort Analysis)。事实上,数据不会说谎,只是分析数据的人没有做到精准分析而导致对数据呈现的错误解读! 国内对同期群分析相关 阅读全文
posted @ 2019-12-31 11:17 悦光阴 阅读(1175) 评论(0) 推荐(0)
摘要: 异常值在统计学上的全称是疑似异常值,也称作离群点(outlier),异常值的分析也称作离群点分析。异常值是指样本中出现的“极端值”,数据值看起来异常大或异常小,其分布明显偏离其余的观测值。异常值分析是检验数据中是否存在不合常理的数据,在数据分析中,既不能忽视异常值的存在,也不能简单地把异常值从数据分 阅读全文
posted @ 2019-12-27 18:53 悦光阴 阅读(18378) 评论(0) 推荐(2)
摘要: 在运行以下Python代码时,Pandas抛出SettingWithCopyWarning警告: row_data = df_pred.loc[key] row_data['col'] = new_value df_pred是一个数据框,根据索引从数据框中获取一行,然后对该行的一个字段进行赋值,警告 阅读全文
posted @ 2019-12-13 19:03 悦光阴 阅读(7494) 评论(3) 推荐(4)
摘要: 向量化和广播这两个概念是 numpy 内部实现的基础。有了向量化,编写代码时无需使用显式循环。广播(Broadcasting)机制描述了 numpy 如何在算术运算期间处理具有不同形状的数组,让较小的数组在较大的数组上“广播”,以便它们具有兼容的形状。两个形状相同的NumPy数组之间的操作是按元素操 阅读全文
posted @ 2019-12-11 16:13 悦光阴 阅读(2243) 评论(0) 推荐(1)
摘要: 整理SQL Server中经常出现的等待类型。 一,CXCONSUMER CXCONSUMER: Occurs with parallel query plans when a consumer thread waits for a producer thread to send rows. Thi 阅读全文
posted @ 2019-12-05 08:25 悦光阴 阅读(1739) 评论(0) 推荐(2)
摘要: 在SQL Server的内部存储中,日期和时间不是以字符串的形式存储的,而是使用整数来存储的。使用特定的格式来区分日期部分和时间部分的偏移量,并通过基准日期和基准时间来还原真实的数据。 一,DateTime的内部存储 SQL Server存储引擎把DateTime类型存储为2个int32类型,共8个 阅读全文
posted @ 2019-12-04 08:38 悦光阴 阅读(3450) 评论(0) 推荐(1)
摘要: 数据存储的基本单元是Page,每个Page是8KB,数据文件(mdf和ndf)占用的硬盘空间,逻辑上按照PageNumber进行划分,也就是说,可以把数据文件看作是PageNumber 从0到n的连续Page。硬盘IO的基本单元是Page,这意味着,SQL Server对整个Page执行读写操作。一 阅读全文
posted @ 2019-12-03 09:01 悦光阴 阅读(680) 评论(0) 推荐(1)
摘要: 一个表或Index使用的数据页空间是由IAM Page Chain来管理的。SQL Server 使用一个IAM(Index Allocation Map)Page来管理数据库文件中最多4GB的空间,一个IAM Page映射文件中4GB大小中的区(Extent),区由8个物理地址连续的Page构成, 阅读全文
posted @ 2019-12-02 17:15 悦光阴 阅读(905) 评论(0) 推荐(1)
摘要: Query Store是SQL Server 2016中引入的、语句级别的性能监控和调优工具,它不仅自动捕获查询(Query)、执行计划(Plan)、运行时统计信息(Runtime)和等待(Wait)统计的信息,而且还可以识别出由于执行计划更改而导致的性能差异,简化了性能故障排除的流程,降低了性能优 阅读全文
posted @ 2019-11-29 15:17 悦光阴 阅读(2399) 评论(2) 推荐(3)
摘要: 正则表达式在文本查询方面,不管是速度还是功能,都十分强大。虽然SQL Server数据库可以执行模糊查询(像like子句)和全文查询(Fulltext search),但是这两个子句只能查询简单的模式,无法应对复杂的查询需求。这是因为SQL Server没有执行正则表达式的内置函数,无法直接执行正则 阅读全文
posted @ 2019-11-28 15:00 悦光阴 阅读(1351) 评论(0) 推荐(1)
摘要: 本文整理C#正则表达式的元字符,正则表达式是由字符构成的表达式,每个字符代表一个规则,表达式中的字符分为两种类型:普通字符和元字符。普通字符是指字面含义不变的字符,按照完全匹配的方式匹配文本,而元字符具有特殊的含义,代表一类字符。 把文本看作是字符流,每个字符放在一个位置上,例如,正则表达式 “Ro 阅读全文
posted @ 2019-11-22 18:35 悦光阴 阅读(5991) 评论(0) 推荐(5)
摘要: 动态数据掩码(Dynamic Data Masking,简称为DDM)能够防止把敏感数据暴露给未经授权的用户。DDM作用于数据表的字段上,在查询结果中隐藏敏感数据。启用DDM不会修改表中的数据,只是把查询结果对未经授权的用户屏蔽,使未授权用户看到的查询结果是被掩码的,例如,第二列是号码列,前7个数字 阅读全文
posted @ 2019-11-07 18:13 悦光阴 阅读(1592) 评论(0) 推荐(0)
摘要: PowerBI Service 有时也称作PowerBI Online,是PowerBI的Saas(Software as a service)部分。在典型的PowerBI开发的工作流程中,用户使用PowerBI Desktop创建Report,然后把该Report发布到PowerBI Servic 阅读全文
posted @ 2019-11-06 21:20 悦光阴 阅读(3743) 评论(0) 推荐(1)
摘要: Power BI支持行级安全(Row-Level Security,RLS)的权限控制,用于限制用户对Dashboard、报表和DataSet的访问。用户浏览的报表是相同的,但是看到的数据却是不同的。 RLS内部通过DAX函数 username() 和 userprincipalname()来实现, 阅读全文
posted @ 2019-11-01 18:01 悦光阴 阅读(3503) 评论(0) 推荐(1)
摘要: SQL Server的安全主体主要分为Login、User和Role,不仅有ID属性,还有Name属性和SID属性,SID是指Security ID。 一,查看数据库用户 数据库主体,可以从sys.database_principals中查看,不仅包含User,还包括数据库角色(DATABASE_R 阅读全文
posted @ 2019-10-30 13:00 悦光阴 阅读(1474) 评论(0) 推荐(0)
摘要: 连接远程桌面(Remote Desktop Connection)出现以下异常, 出现该Issue的原因,我推测是由于winlogon.exe进程没有关闭。 解决方法是使用其他账号登录到远程主机中,把与账号相关的winlogon.exe进程结束。 1,查询会话 使用其他用户的账号登录到远程主机,以管 阅读全文
posted @ 2019-10-28 17:36 悦光阴 阅读(2153) 评论(0) 推荐(0)
摘要: 数组索引是指使用中括号 [] 来定位数据元素,不仅可以定位到单个元素,也可以定位到多个元素。索引基于0,并接受从数组末尾开始索引的负索引。 举个例子,正向索引从0开始,从数组开始向末尾依次加1递增;负向索引从-1开始,逐个元素 -1 ,不管使用正向索引还是负向索引,最右侧的元素的索引值是最大的,最左 阅读全文
posted @ 2019-10-10 10:35 悦光阴 阅读(2675) 评论(0) 推荐(0)
摘要: 数据框是用于存储数据的二维结构,分为行和列,一行和一列的交叉位置是一个cell,该cell的位置是由行索引和列索引共同确定的。可以通过at/iat,或loc/iloc属性来访问数据框的元素,该属性后跟一个中括号:[row,col],中括号内 row表示行索引或行标签,col表示列索引或列标签。如果省 阅读全文
posted @ 2019-10-09 10:33 悦光阴 阅读(12805) 评论(0) 推荐(2)
摘要: 在日常的数据处理中,经常会对一个DataFrame进行逐行、逐列和逐元素的操作,对应这些操作,Pandas中的map、apply和applymap可以解决绝大部分这样的数据处理需求。 一,apply apply是指沿着DataFrame的轴(axis)调用一个函数: DataFrame.apply( 阅读全文
posted @ 2019-10-08 13:43 悦光阴 阅读(3959) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 28 下一页