2020 年 2月随笔档案 - 落日峡谷

hive的lower，upper，length，concat，lpad，rpad，cast，split函数简述

摘要：hive的部分字符串函数，包括： 1. 小写：lower 或者 lcase 函数 select lower('App') #结果是：app select lcase('App') 2. upper 或者 ucase 函数 select upper('App') #结果是：APP select uca 阅读全文

posted @ 2020-02-29 20:03 落日峡谷阅读(8346) 评论(0) 推荐(0) 编辑

hive的floor函数，ceil函数，round函数

摘要：hive的floor函数和ceil函数与python、sql等一致 1. floor函数 select floor(1.4) # 结果是：1 2. ceil函数 select ceil(1.4) #结果是：2 3. hive的round函数与python稍微有点差别首先说hive的round：直接阅读全文

posted @ 2020-02-29 19:46 落日峡谷阅读(25430) 评论(0) 推荐(0) 编辑

Pandas建立空的dataframe和cumsum累加函数

摘要：探索一下Pandas的累加函数cumsum，我们可以先建立一个空的dataframe，用于存放接下来的值。 import pandas as pd columns = ['id_','name','money'] data_frame = pd.DataFrame(columns = columns 阅读全文

posted @ 2020-02-22 20:07 落日峡谷阅读(10831) 评论(0) 推荐(0) 编辑

Python基础笔记二之求序列均值、标准差、中位数、分位数

摘要：python可以通过numpy库来快速实现数组/序列运算，包括均值、标准差、分位数等。 1. 首先导入包numpy import numpy as np 2. 建立序列，可用 np.array aa = np.array([1,2,3,4,5]) 3. 求均值 np.mean： print(np.m 阅读全文

posted @ 2020-02-22 17:59 落日峡谷阅读(3737) 评论(0) 推荐(0) 编辑

Word2Vec 计算词语之间的余弦相似度

摘要：python中常用的分析文档、计算词语相似度的包 —— Word2Vec函数；该函数在gensim.models.Word2Vec包内。分析文本和计算相似度有几个步骤：导入需要用到的库： # 导入第三包 import jieba import pandas as pd import gensim 阅读全文

posted @ 2020-02-22 14:41 落日峡谷阅读(13028) 评论(0) 推荐(0) 编辑

Mysql的数据类型

摘要：Mysql的数据类型有很多，主要可以分为三大类：数值类型、字符串类型、时间和日期类型。注意：一个汉字3个字节（utf-8）;2个字节（gbk）： select length(name_adress) from my_test_copy as len; #该列的各个长度，字节，一个汉字3个字节（阅读全文

posted @ 2020-02-21 19:55 落日峡谷阅读(187) 评论(0) 推荐(0) 编辑

Mysql截取字符串

摘要：在Mysql中，有时候会用到截取字符串然后相互连接的情形，其中截取字符串用的是SUBSTRING操作，连接用的是CONCAT操作： 1. 直接截取 SELECT LEFT('what is your name? please tell me',5); #从左开始截取字符串，left(str, len 阅读全文

posted @ 2020-02-20 21:52 落日峡谷阅读(3056) 评论(0) 推荐(0) 编辑

Mysql的join语句

摘要：mysql超强功能之一：join # group by 必须放在 order by 和 limit之前，不然会报错 # 你可以在 SELECT, UPDATE 和 DELETE 语句中使用 Mysql 的 JOIN 来联合多表查询。 # JOIN 常用分为如下三类(但不仅仅只有这三类)： # INN 阅读全文

posted @ 2020-02-20 21:35 落日峡谷阅读(1261) 评论(0) 推荐(0) 编辑

Excel的VLOOKUP函数

摘要：当有两个表要进行对比时，VLOOKUP可以很快帮我们解决问题。例如：当要比较两次数据中，相同项目的变化率，VLOOKUP可以快速得到想要的结果。 1. 首先使用VLOOKUP得到前一次的数据值，在新一列的对应行即E2框输入：=VLOOKUP(C2,A:B,2,FALSE)，然后回车，之后下拉填充阅读全文

posted @ 2020-02-18 10:28 落日峡谷阅读(809) 评论(0) 推荐(0) 编辑

python求极值点（波峰波谷）

摘要：python求极值点主要用到scipy库。 1. 首先可先选择一个函数或者拟合一个函数，这里选择拟合数据：np.polyfit import pandas as pd import matplotlib.pyplot as plt import numpy as np from scipy impo 阅读全文

posted @ 2020-02-17 21:20 落日峡谷阅读(32354) 评论(0) 推荐(1) 编辑

python多项式拟合：np.polyfit 和 np.polyld

摘要：python数据拟合主要可采用numpy库，库的安装可直接用pip install numpy等。 1. 原始数据：假如要拟合的数据yyy来自sin函数，np.sin import numpy as np import matplotlib.pyplot as plt xxx = np.arange 阅读全文

posted @ 2020-02-17 20:47 落日峡谷阅读(56696) 评论(0) 推荐(5) 编辑

落日峡谷

02 2020 档案

hive的lower，upper，length，concat，lpad，rpad，cast，split函数简述

hive的floor函数，ceil函数，round函数

Pandas建立空的dataframe和cumsum累加函数

Python基础笔记二之求序列均值、标准差、中位数、分位数

Word2Vec 计算词语之间的余弦相似度

Mysql的数据类型

Mysql截取字符串

Mysql的join语句

Excel的VLOOKUP函数

python求极值点（波峰波谷）

python多项式拟合：np.polyfit 和 np.polyld

公告

导航

统计

搜索

常用链接

我的标签

积分与排名

随笔分类 (171)

随笔档案 (150)

阅读排行榜

评论排行榜

推荐排行榜

最新评论