摘要:
一、case when 需求:按薪资排序高中低 需求:将emp表的奖金这列如果说没有显示0而不是null 二、cast 阅读全文
摘要:
现有CSV/EXCEL文件一个,为简化期间,为一个3x3的数据文件,内容如下:1,2,32,1,33,2,1用pandas.read读取以后,第一行自动被识别为columns,造成数据出错 1 2 30 2 1 31 3 2 1有没有什么命令可以添加自定义的columns的名字,比如我想命名为 A, 阅读全文
摘要:
X = data.iloc[:,data.columns != "Survived"]y = data.iloc[:,data.columns == "Survived"] 阅读全文
摘要:
对于DataFrame的一些操作 DataFrame.drop()inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe;参数 inplace=True 则会直接在原数据上进行删除操作,删除后就回不来了axis=0,指删除index,因此删除columns时要指定axis=1;data = pd.read_csv(路径)data.drop(["... 阅读全文
摘要:
1、appendToFile 功能:将一个或多个源文件系统的内容追加至目标文件系统 使用方法:hadoop fs -appendToFile 源文件1,源文件2... 目标文件 hadoop fs -appendToFile /flume/web_output/part-r-00000 /flume 阅读全文
摘要:
import numpy as np import pandas as pd df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d']) df2=pd.DataFrame(np.ones((3,4))*1,columns=['a','b','c','d']) df3=pd.DataFrame(np.ones((3,4))*2,colu... 阅读全文
摘要:
import pandas as pd data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],'year': [2000, 2001, 2002, 2001, 2002],'pop': [1.5, 1.7, 3.6, 2.4, 2.9]} # 建立DataFrame对象 frame1 = pd.DataFrame(data)... 阅读全文
摘要:
用了这么久的左连接,真是蠢死了。 本次知识总结为一对多的理解 , 进行左连接 ,很明显是一对多的情况 上结果: 会把多的全都显示出来 阅读全文