摘要: 一、case when 需求:按薪资排序高中低 需求:将emp表的奖金这列如果说没有显示0而不是null 二、cast 阅读全文
posted @ 2019-03-04 11:18 詹岩鹏 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 现有CSV/EXCEL文件一个,为简化期间,为一个3x3的数据文件,内容如下:1,2,32,1,33,2,1用pandas.read读取以后,第一行自动被识别为columns,造成数据出错 1 2 30 2 1 31 3 2 1有没有什么命令可以添加自定义的columns的名字,比如我想命名为 A, 阅读全文
posted @ 2019-02-28 11:40 詹岩鹏 阅读(10878) 评论(0) 推荐(0) 编辑
摘要: X = data.iloc[:,data.columns != "Survived"]y = data.iloc[:,data.columns == "Survived"] 阅读全文
posted @ 2019-02-25 10:24 詹岩鹏 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 对于DataFrame的一些操作 DataFrame.drop()inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe;参数 inplace=True 则会直接在原数据上进行删除操作,删除后就回不来了axis=0,指删除index,因此删除columns时要指定axis=1;data = pd.read_csv(路径)data.drop(["... 阅读全文
posted @ 2019-02-22 13:58 詹岩鹏 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 1、appendToFile 功能:将一个或多个源文件系统的内容追加至目标文件系统 使用方法:hadoop fs -appendToFile 源文件1,源文件2... 目标文件 hadoop fs -appendToFile /flume/web_output/part-r-00000 /flume 阅读全文
posted @ 2019-02-20 13:15 詹岩鹏 阅读(205) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import pandas as pd df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d']) df2=pd.DataFrame(np.ones((3,4))*1,columns=['a','b','c','d']) df3=pd.DataFrame(np.ones((3,4))*2,colu... 阅读全文
posted @ 2019-02-15 16:32 詹岩鹏 阅读(1875) 评论(0) 推荐(0) 编辑
摘要: import pandas as pd data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],'year': [2000, 2001, 2002, 2001, 2002],'pop': [1.5, 1.7, 3.6, 2.4, 2.9]} # 建立DataFrame对象 frame1 = pd.DataFrame(data)... 阅读全文
posted @ 2019-02-15 16:22 詹岩鹏 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 用了这么久的左连接,真是蠢死了。 本次知识总结为一对多的理解 , 进行左连接 ,很明显是一对多的情况 上结果: 会把多的全都显示出来 阅读全文
posted @ 2019-01-08 10:30 詹岩鹏 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 有时我们要把查询的结果保存到新表里,创建新表,查询,插入显得十分麻烦。 其实直接可以搞定。例如把表2的查询结果插入表1: 如果表存在: 如果表不存在: 阅读全文
posted @ 2018-12-08 16:28 詹岩鹏 阅读(2752) 评论(0) 推荐(0) 编辑
摘要: 作为小白 ,自己下载了MySQL数据库,然后长期自己存数据,都是独自在做,完全没想到连接这个事。最近,工作中给同事安装数据库,才突然想到可以让别人链接自己的,哎,真是个傻子。我的傻除了这个以外,还有。。。。。我下载了navicate for mysql ,一直痴迷在怎么用navicate去连接别人的 阅读全文
posted @ 2018-12-08 11:32 詹岩鹏 阅读(125) 评论(0) 推荐(0) 编辑