02 2020 档案

hive的lower,upper,length,concat,lpad,rpad,cast,split函数简述
摘要:hive的部分字符串函数,包括: 1. 小写:lower 或者 lcase 函数 select lower('App') #结果是:app select lcase('App') 2. upper 或者 ucase 函数 select upper('App') #结果是:APP select uca 阅读全文

posted @ 2020-02-29 20:03 落日峡谷 阅读(8346) 评论(0) 推荐(0) 编辑

hive的floor函数,ceil函数,round函数
摘要:hive的floor函数和ceil函数与python、sql等一致 1. floor函数 select floor(1.4) # 结果是:1 2. ceil函数 select ceil(1.4) #结果是:2 3. hive的round函数与python稍微有点差别 首先说hive的round:直接 阅读全文

posted @ 2020-02-29 19:46 落日峡谷 阅读(25430) 评论(0) 推荐(0) 编辑

Pandas建立空的dataframe和cumsum累加函数
摘要:探索一下Pandas的累加函数cumsum,我们可以先建立一个空的dataframe,用于存放接下来的值。 import pandas as pd columns = ['id_','name','money'] data_frame = pd.DataFrame(columns = columns 阅读全文

posted @ 2020-02-22 20:07 落日峡谷 阅读(10831) 评论(0) 推荐(0) 编辑

Python基础笔记二之求序列均值、标准差、中位数、分位数
摘要:python可以通过numpy库来快速实现数组/序列运算,包括均值、标准差、分位数等。 1. 首先导入包numpy import numpy as np 2. 建立序列,可用 np.array aa = np.array([1,2,3,4,5]) 3. 求均值 np.mean: print(np.m 阅读全文

posted @ 2020-02-22 17:59 落日峡谷 阅读(3737) 评论(0) 推荐(0) 编辑

Word2Vec 计算词语之间的余弦相似度
摘要:python中常用的分析文档、计算词语相似度的包 —— Word2Vec函数;该函数在gensim.models.Word2Vec包内。 分析文本和计算相似度有几个步骤: 导入需要用到的库: # 导入第三包 import jieba import pandas as pd import gensim 阅读全文

posted @ 2020-02-22 14:41 落日峡谷 阅读(13028) 评论(0) 推荐(0) 编辑

Mysql的数据类型
摘要:Mysql的数据类型有很多,主要可以分为三大类: 数值类型、字符串类型、时间和日期类型。 注意: 一个汉字3个字节(utf-8);2个字节(gbk): select length(name_adress) from my_test_copy as len; #该列的各个长度,字节,一个汉字3个字节( 阅读全文

posted @ 2020-02-21 19:55 落日峡谷 阅读(187) 评论(0) 推荐(0) 编辑

Mysql截取字符串
摘要:在Mysql中,有时候会用到截取字符串然后相互连接的情形,其中截取字符串用的是SUBSTRING操作,连接用的是CONCAT操作: 1. 直接截取 SELECT LEFT('what is your name? please tell me',5); #从左开始截取字符串,left(str, len 阅读全文

posted @ 2020-02-20 21:52 落日峡谷 阅读(3056) 评论(0) 推荐(0) 编辑

Mysql的join语句
摘要:mysql超强功能之一:join # group by 必须放在 order by 和 limit之前,不然会报错 # 你可以在 SELECT, UPDATE 和 DELETE 语句中使用 Mysql 的 JOIN 来联合多表查询。 # JOIN 常用分为如下三类(但不仅仅只有这三类): # INN 阅读全文

posted @ 2020-02-20 21:35 落日峡谷 阅读(1261) 评论(0) 推荐(0) 编辑

Excel的VLOOKUP函数
摘要:当有两个表要进行对比时,VLOOKUP可以很快帮我们解决问题。 例如:当要比较两次数据中,相同项目的变化率,VLOOKUP可以快速得到想要的结果。 1. 首先使用VLOOKUP得到前一次的数据值,在新一列的对应行即E2框输入:=VLOOKUP(C2,A:B,2,FALSE),然后回车,之后下拉填充 阅读全文

posted @ 2020-02-18 10:28 落日峡谷 阅读(809) 评论(0) 推荐(0) 编辑

python求极值点(波峰波谷)
摘要:python求极值点主要用到scipy库。 1. 首先可先选择一个函数或者拟合一个函数,这里选择拟合数据:np.polyfit import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy impo 阅读全文

posted @ 2020-02-17 21:20 落日峡谷 阅读(32354) 评论(0) 推荐(1) 编辑

python多项式拟合:np.polyfit 和 np.polyld
摘要:python数据拟合主要可采用numpy库,库的安装可直接用pip install numpy等。 1. 原始数据:假如要拟合的数据yyy来自sin函数,np.sin import numpy as np import matplotlib.pyplot as plt xxx = np.arange 阅读全文

posted @ 2020-02-17 20:47 落日峡谷 阅读(56696) 评论(0) 推荐(5) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示