摘要:hive的部分字符串函数,包括: 1. 小写:lower 或者 lcase 函数 select lower('App') #结果是:app select lcase('App') 2. upper 或者 ucase 函数 select upper('App') #结果是:APP select uca
阅读全文
摘要:hive的floor函数和ceil函数与python、sql等一致 1. floor函数 select floor(1.4) # 结果是:1 2. ceil函数 select ceil(1.4) #结果是:2 3. hive的round函数与python稍微有点差别 首先说hive的round:直接
阅读全文
摘要:探索一下Pandas的累加函数cumsum,我们可以先建立一个空的dataframe,用于存放接下来的值。 import pandas as pd columns = ['id_','name','money'] data_frame = pd.DataFrame(columns = columns
阅读全文
摘要:python可以通过numpy库来快速实现数组/序列运算,包括均值、标准差、分位数等。 1. 首先导入包numpy import numpy as np 2. 建立序列,可用 np.array aa = np.array([1,2,3,4,5]) 3. 求均值 np.mean: print(np.m
阅读全文
摘要:python中常用的分析文档、计算词语相似度的包 —— Word2Vec函数;该函数在gensim.models.Word2Vec包内。 分析文本和计算相似度有几个步骤: 导入需要用到的库: # 导入第三包 import jieba import pandas as pd import gensim
阅读全文
摘要:Mysql的数据类型有很多,主要可以分为三大类: 数值类型、字符串类型、时间和日期类型。 注意: 一个汉字3个字节(utf-8);2个字节(gbk): select length(name_adress) from my_test_copy as len; #该列的各个长度,字节,一个汉字3个字节(
阅读全文
摘要:在Mysql中,有时候会用到截取字符串然后相互连接的情形,其中截取字符串用的是SUBSTRING操作,连接用的是CONCAT操作: 1. 直接截取 SELECT LEFT('what is your name? please tell me',5); #从左开始截取字符串,left(str, len
阅读全文
摘要:mysql超强功能之一:join # group by 必须放在 order by 和 limit之前,不然会报错 # 你可以在 SELECT, UPDATE 和 DELETE 语句中使用 Mysql 的 JOIN 来联合多表查询。 # JOIN 常用分为如下三类(但不仅仅只有这三类): # INN
阅读全文
摘要:当有两个表要进行对比时,VLOOKUP可以很快帮我们解决问题。 例如:当要比较两次数据中,相同项目的变化率,VLOOKUP可以快速得到想要的结果。 1. 首先使用VLOOKUP得到前一次的数据值,在新一列的对应行即E2框输入:=VLOOKUP(C2,A:B,2,FALSE),然后回车,之后下拉填充
阅读全文
摘要:python求极值点主要用到scipy库。 1. 首先可先选择一个函数或者拟合一个函数,这里选择拟合数据:np.polyfit import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy impo
阅读全文
摘要:python数据拟合主要可采用numpy库,库的安装可直接用pip install numpy等。 1. 原始数据:假如要拟合的数据yyy来自sin函数,np.sin import numpy as np import matplotlib.pyplot as plt xxx = np.arange
阅读全文