摘要:
序列内置一些函数,用于循环对序列的元素执行操作。 一,应用和转换函数 应用apply 对序列的各个元素应用函数: Series.apply(self, func, convert_dtype=True, args=(), **kwds) 参数注释: func:应用的函数,可以是自定义的函数,或Num 阅读全文
摘要:
字典是键/值对构成的集合,字典通过大括号来创建,字典的键是字符串,而值可以是任何数据对象。 字典有两个重要的特征: 字典是无序的,字典项没有特定的顺序,只能通过键来获取值; 字典是可变的,支持原处修改键的值; 字典是作为散列表来实现的,可增长,搜索非常快速; 和列表一样,字典存储的是对象的引用,不是 阅读全文
摘要:
序列是一维数组,只有一个维度(或称作轴)是行(row),在访问序列时,只需要设置一个索引。序列(Series)是由一组相同类型的数据,以及一组与之相关的行标签(索引)组成,序列要求存储的数据类型是相同的。 在创建序列时,如果没有设置索引,那么pandas自动为序列创建了一个从0开始到N-1的序号,称 阅读全文
摘要:
pandas是基于NumPy构建的模块,是数据分析必不可少的包之一,通常情况下,引入pandas的约定,只要在代码中看到pd,就要联想到pandas: import pandas as pd pandas包含两种最主要数据结构:序列(Series)和数据框(DataFrame)。对于这两个数据结构, 阅读全文
摘要:
关于计值上下文的规则: 筛选上下文用于筛选数据。 行上下文用于迭代,其中的筛选上下文为空,除非遇到CALCULATE函数。 一,CALCULATE函数根据行上下文创建筛选上下文 CALCULATE函数的强大之处:根据行上下文创建筛选上下文。 如果在行上下文中执行CALCULATE函数,对每一次迭代, 阅读全文
摘要:
表连接是指两张表根据关联字段,组合成一个数据集。表连接不仅可以利用数据模型中已有的关系,而且可以利用DAX表达式基于表的任意列定义连接条件。因此,在DAX中,实现表与表之间的连接,有两种方式: 第一种方式:利用数据模型中的现有关系,以便查询包含在不同表中的数据。 第二种方式:编写 DAX 表达式创建 阅读全文
摘要:
SUMMARIZECOLUMNS是一个专门用于查询和计算表的函数,主要包含分组列和扩展列。 分组列是用于分组的列,只能来源于基础表中已有的列,分组列可以来源于同一个表,也可以来源于相关的列。 扩展列是由name和expression对构成的,name是字符串,expression是包含聚合函数的表达 阅读全文
摘要:
阻塞就是常说的等待(wait),是指事务A等待特定的资源得到满足之后,才能继续执行下去。发生阻塞的另外一种情况是被其他事务阻塞。阻塞对性能的影响,有时会比死锁更严重,这是因为死锁持续的时间非常短,SQL Server 一旦探测到死锁的发生,就会立即杀死一个进程,以结束死锁,使其他进程能够正常运行下去 阅读全文
摘要:
SQL Server 并发控制 第一篇:并发模式和事务 SQL Server 并发控制 第二篇:隔离级别和锁(1) SQL Server 并发控制 第三篇:隔离级别和行版本(2) 隔离级别定义事务处理数据读取操作的隔离程度,在悲观并发模式下,隔离级别只会影响读操作申请的共享锁(Shared Lock 阅读全文
摘要:
数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求(Query Request),查询优化器就会执行以下工作流程: 编译请求:对TSQL语句进行语法解析,编译请求,生成TSQL语句表示的逻辑结构。 查询优化:根据TSQL语句的逻辑结构,生成多个预估的执行方 阅读全文
摘要:
Windows 任务调度程序(Task Scheduler)可以定时执行程序,本文分享使用Task Scheduler定时执行Python脚本的两种方法。 在控制面版->管理员工具中打开 Task Scheduler : 在Task Scheduler Library中创建一个新的文件夹demo,右 阅读全文
摘要:
K最邻近(k-Nearest Neighbors,KNN)分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类。 一,knn算法的逻辑 knn算法的核心思想是:如果一个数据在特征空间中最相邻的k个数 阅读全文
摘要:
sklearn.preprocessing包提供了几个常用的转换函数,用于把原始特征向量转换为更适合估计器的表示。 转化器(Transformer)用于对数据的处理,例如标准化、降维以及特征选择等,提供的函数大致是: fit(x,y):该方法接受输入和标签,计算出数据变换的方式。 transform 阅读全文
摘要:
机器学习主要用于解决分类、回归和聚类问题,分类属于监督学习算法,是指根据已有的数据和标签(分类的类别)进行学习,预测未知数据的标签。分类问题的目标是预测数据的类别标签(class label),可以把分类问题划分为二分类和多分类问题。二分类是指在两个类别中选择一个类别,在二分类问题中,其中一个类别称 阅读全文
摘要:
迭代是指逐行遍历表,访问一行叫做一次迭代,而每一次迭代得到的结果会作为下一次迭代的初始值。迭代函数至少拥有两个参数: 第一个参数:要遍历的行集 第二个参数:对同一行的不同字段要执行计算的表达式。 一,迭代函数计算的过程 最常见的迭代函数是SUMX函数,第一个参数Sales是要迭代的表或表值表达式,第 阅读全文
摘要:
CALCULATE()函数是DAX中最重要和最复杂的函数,用于计算处在筛选上下文中的表达式的值。 CALCULATE(<expression>,<filter1>,<filter2> … ) 第一个参数是用于计值的表达式,在计值之前,CALCULATE将首先计算<filter>参数,并与现有的外部筛 阅读全文
摘要:
Visual上的任何一行或一列都是一个过滤上下文,切片器也是一个过滤上下文,或者报表上其他类型的过滤器,甚至Visual之间的交互,这些过滤上下文共同构成了一个单元格的过滤上下文。总的来说,报表的每个元素都可以创建过滤上下文,并且报表的每个单元格都有不同的过滤上下文。总结来说,筛选上下文是在报表中创 阅读全文
摘要:
计算上下文是DAX表达式求值的环境,任何DAX表达式都是在上下文中求值的。行上下文和筛选上下文是DAX中仅有的上下文类型,把这两种上下文称为计算上下文。计算上下文用于限定公式计算的环境,当上下文变化时,相同的公式会计算出不同的结果。 在PowerBI中创建的计算列是在行上下文中执行计算,创建的度量( 阅读全文
摘要:
DAX是一种专门用于计算数据模型的业务公式的语言,本文以Power BI的关系来学习数据模型。 一,理解数据模型 数据模型是由一组表和关系构成的结构,表和表之间由关系链接,如下图所示的产品数据模型: 表格是组织数据的二维结构,由行和列构成,其本身是一个最简单的数据模型。当要描述更复杂的数据模型时,就 阅读全文
摘要:
Git 基本操作系列博客: Git 第一篇:简单介绍 Git 第二篇:基本操作 Git 第三篇:VS Code使用Git管理代码 Git 第四篇:使用VS2013和git进行代码管理 Git的基本操作主要是创建本地库、增加内容,提交修改 ,并把修改同步到远程库,常用的命令是git clone、git 阅读全文