摘要:
博文参考:https://www.cnblogs.com/tashanzhishi/p/10917956.html 如果你们学习过Python,可以用Python来对Hbase进行操作。 happybase使用:https://happybase.readthedocs.io/en/latest/u 阅读全文
摘要:
hbase是bigtable的开源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。 它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储 阅读全文
摘要:
项目中用python来链接impala数据库最常见,一个简单的链接,获取结果。 #!/usr/bin/python # -*- coding:utf-8 -*- from impala.dbapi import connect import sys reload(sys) sys.setdefaul 阅读全文
摘要:
python想直接读取hadoop上的文件内容,一番操作,头发掉了几根,也没能解析出来parquet文件类型的文件。 本博文简单讲解一下TEXTFILE文件格式的解析: 需要安装模块hdfs from hdfs.client import Client client = Client("http:/ 阅读全文
摘要:
这个错误困扰了好久,因为集群有多台,暂放到其他几台机器上执行了SQL操作,一直在找解决方法,无意间得到真传,喜出望外啊 报错信息: Traceback (most recent call last): File "b.py", line 3, in <module> cur=conn.cursor( 阅读全文