摘要: 1、直接执行.sql脚本 2、Hive语句执行 假如有如下hive sql:hive_cmd = 'hive -e "select count(*) from hbase.routermac_sort_10;"'一般在python中按照如下方式执行该hive sql:os.system(hive_c 阅读全文
posted @ 2018-09-24 18:14 静悟生慧 阅读(5250) 评论(0) 推荐(0) 编辑
摘要: Tesseract-OCR的Training简明教程 https://blog.csdn.net/blueheart20/article/details/53207176 一、安装: 选择对应版本,https://digi.bib.uni-mannheim.de/tesseract/ 1:下载安装包 阅读全文
posted @ 2018-09-24 17:32 静悟生慧 阅读(4074) 评论(0) 推荐(0) 编辑
摘要: https://mp.weixin.qq.com/s?__biz=MzA3MDExNzcyNA==&mid=402907292&idx=1&sn=889c4abcf576e24525ea6a705069c4de https://blog.csdn.net/zgwangbo/article/detai 阅读全文
posted @ 2018-09-24 12:13 静悟生慧 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 1.set_index DataFrame可以通过set_index方法,可以设置单索引和复合索引。 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) append添加新 阅读全文
posted @ 2018-09-24 10:51 静悟生慧 阅读(15840) 评论(0) 推荐(1) 编辑
摘要: 1. df.head(n): 显示数据前n行,不指定n,df.head则会显示所有的行 2. df.columns.values获取所有列索引的名称 3. df.column_name: 直接获取列column_name的数据 4. pd.unique(Series)获取Series中元素的唯一值( 阅读全文
posted @ 2018-09-24 10:07 静悟生慧 阅读(3145) 评论(0) 推荐(0) 编辑
摘要: 说明:直接contact之后,index只是重复,而不是变成我们希望的那样,这样在后续的操作中,容易出现逻辑错误。 df4 = pd.DataFrame({'val':[0,1,2,3,4,5,6,7,8,9,10,11],'A': ['A0', 'A1', 'A2', 'A3','A4', 'A5 阅读全文
posted @ 2018-09-24 09:32 静悟生慧 阅读(1556) 评论(0) 推荐(0) 编辑