11 2018 档案
摘要:近期,在使用Oracle的过程中,由以下两段代码的执行引发的思考,到底 select * from a,b where a.id = b.id 和 select * from a inner join b on a.id = b.id 有没有区别? 经过好一番查资料验证,最后更加迷惑。。。 …… …
阅读全文
摘要:R语言中排序有几个基本函数:sort()、rank()、order()、arrange() 一、总结 sort()函数是对向量进行从小到大的排序 rank()函数返回的是对向量中每个数值对应的秩 order()函数返回的值表示位置,依次对应的是向量的最小值、次小值、第三小值……最大值等(位置索引)
阅读全文
摘要:一、总结 组合数:choose(n,k) —— 从n个中选出k个 阶乘:factorial(k) —— k! 排列数:choose(n,k) * factorial(k) 幂:^ 余数:%% 整数商:%/% 列出所有组合数矩阵:combn(x,n) t(combn(x,n)) 转置 二、具体例子 E
阅读全文
摘要:在实际编程中,Null容易引起很多问题,例如在Java里NullPointerException猝不及防的空指针异常,因此需要过多的if判断,甚是麻烦。 在MySQL数据库中也要少用Null,尽量保持字段not null,主要原因有以下。 1.Null使用起来很方便,创建数据表时默认,插入数据的时候
阅读全文
摘要:由于工作环境中oracle版本为10g,不支持行转列函数pivot,特在自己电脑上安装了oracle 11g,但因为不经常使用,便把服务自动启动给关闭了,只在需要使用时手动启动,因此记录一下需要启动的各个服务具体情况。 windows 7 64位 oracle 11g R2 共有7个服务,具体如下:
阅读全文
摘要:原始表数据如下: 需求:现要求按分号“;”将rate_item列进行分割后插入到新的数据表中。 创建函数之后,调用函数。 结果如下: END 2018-11-07 00:10:02
阅读全文
摘要:在数据挖掘项目中,有时候个体的出生日期包含信息量过大,不适合作为一个有效数据进入模型算法训练,因此有必要把出生日期转化为年龄age,age是一个很好的特征工程指示变量。 1.首先将birth转化为标准时间格式 2.获取当前时间的年份,并且减去birth的年份 使用dt.datetime.today(
阅读全文
摘要:sys模块是Python标准库中自带的一个模块。 sys模块包括了一组非常实用的服务,内含很多函数方法和变量,用来处理Python运行时配置以及资源,从而可以与当前程序之外的系统环境交互,如:Python解释器。 一、导入sys模块 二、sys模块中主要的函数变量 sys.stdin 标准输入流 s
阅读全文
摘要:在Oracle中使用wm_concat(column)可以实现字段的分组合并,逗号分隔。 例如,现有表temp_cwh_test: 1.想按u_id分组,进行goods合并 得到: 2.想按u_id分组,进行goods和num合并 得到: 3.以“|”进行分隔合并 得到: 4.其他 Oracle 1
阅读全文
摘要:数据科学:R & Python 工作 & Kaggle机器学习比赛 可重复函数式编程 一、Python模块的载入 包 Package 模块 module 二、R语言包的载入 install必须加双引号,library可以不加。 pacman包可以一次性加载多个包。 p_load函数可以一次性加载多个
阅读全文
摘要:一、Python 数据框就是典型的关系型数据库的数据存储形式,每一行是一条记录,每一列是一个属性,最终构成表格的形式,这是数据科学家必须熟悉的最典型的数据结构。 1.构建数据框 2.读取csv文件 3.统计描述 二、R语言 R语言中自带data.frame数据框格式,tidyverse包中所使用的t
阅读全文