摘要: 1. hive对开发者使用最多的是通过jdbc,odbc等方式连接来完成对hive的操作。本文介绍通过远程windows系统上的eclipse使用jdbc连接hive并对其进行相应的操作。2. 首先保证windows和hive所在机器能相互连接(ping通)。3. 在windows上建立一个文件夹,将所用到的包全拷贝到这个文件夹之下:hadoop的有关包,hive的有关包。4. 在eclipse上新建项目,代码如下:packageorg.zju.kasuosuo;importjava.sql.Connection;importjava.sql.DriverManager;importjava. 阅读全文
posted @ 2012-07-03 11:14 kasuosuo 阅读(2618) 评论(0) 推荐(0) 编辑
摘要: 1. 首先建立测试数据:/home/nslab/HiveTestData/sample.txt,内容如下:1990 23 21990 21 21990 25 21991 32 21991 34 21991 24 21992 42 21992 32 21992 25 22. 开启hive,输入下面的命令,得到相应的结果: 语句一:创建表records,每一行内容以 '\t' 分割 语句二:将sample.txt文件中的内容导入到表records中,overwrite表示覆盖原表中的内容。 语句三:选择每一年中最高的气温。 根据得到的信息,hive中的sql操作是使用mapredu 阅读全文
posted @ 2012-07-03 11:09 kasuosuo 阅读(2694) 评论(0) 推荐(0) 编辑
摘要: 由于 Hive 采用了 SQL 的查询语言 HQL,因此很容易将 Hive 理解为数据库。其实从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。本文将从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用中,但是Hive 是为数据仓库而设计的,清楚这一点,有助于从应用角度理解 Hive 的特性。Hive 和数据库的比较查询语言HQLSQL数据存储位置HDFSRaw Device 或者 Local FS数据格式用户定义系统决定数据更新不支持支持索引无有执行MapRedcueExecutor执行延迟高低可扩展性高低数据规模大小查询语言。由于 SQL 被 阅读全文
posted @ 2012-07-03 09:53 kasuosuo 阅读(805) 评论(0) 推荐(0) 编辑