kasuosuo - 博客园

2012年7月14日

摘要： View Code 1 #include <iostream> 2 #include <cassert> 3 #include <cmath> 4 using namespace std; 5 6 //数组反转 7 void reverse(int *a,int aLength) 8 { 9 assert(a);10 int i=0;11 int j=aLength-1;12 while(i<j && i<aLength && j>0)13 {14 swap(a[i],a[j]);15 i++;16 j... 阅读全文

posted @ 2012-07-14 16:39 kasuosuo 阅读(567) 评论(0) 推荐(0) 编辑

2012年7月12日

拓扑排序的两种算法

摘要： 1. 拓扑排序主要有两种算法：方法1：《算法导论》上给出的DFS+时间戳；方法2：求顶点入度+贪心算法。2. 两种算法的代码分别如下：View Code 1 static int f[100]={0}; 2 static int ftime=0; 3 //递归深度优先搜索 4 template<typename vertexNametype, typename weight> 5 void ALGraph<vertexNametype, weight>::DFS() 6 { 7 int n=getVertexNumber(); 8 bool *visited=... 阅读全文

posted @ 2012-07-12 12:32 kasuosuo 阅读(1372) 评论(0) 推荐(0) 编辑

2012年7月8日

图相关算法（BFS,DFS等）

摘要： 1. 首先代码如下：View Code 1 #ifndef __GRAPH_H__ 2 #define __GRAPH_H__ 3 4 #include <vector> 5 #include <queue> 6 #include <stack> 7 #define IN 8 #define OUT 9 #define INOUT10 using namespace std;11 12 namespace graphspace13 {14 template <typename weight>15 struct Edge 16 {17 int nD 阅读全文

posted @ 2012-07-08 16:36 kasuosuo 阅读(648) 评论(0) 推荐(0) 编辑

2012年7月3日

在windows上使用eclipse jdbc连接hive

摘要： 1. hive对开发者使用最多的是通过jdbc，odbc等方式连接来完成对hive的操作。本文介绍通过远程windows系统上的eclipse使用jdbc连接hive并对其进行相应的操作。2. 首先保证windows和hive所在机器能相互连接（ping通）。3. 在windows上建立一个文件夹，将所用到的包全拷贝到这个文件夹之下：hadoop的有关包，hive的有关包。4. 在eclipse上新建项目，代码如下：packageorg.zju.kasuosuo;importjava.sql.Connection;importjava.sql.DriverManager;importjava. 阅读全文

posted @ 2012-07-03 11:14 kasuosuo 阅读(2625) 评论(0) 推荐(0) 编辑

Hive入门学习及测试

摘要： 1. 首先建立测试数据：/home/nslab/HiveTestData/sample.txt，内容如下：1990 23 21990 21 21990 25 21991 32 21991 34 21991 24 21992 42 21992 32 21992 25 22. 开启hive，输入下面的命令，得到相应的结果：语句一：创建表records，每一行内容以 '\t' 分割语句二：将sample.txt文件中的内容导入到表records中，overwrite表示覆盖原表中的内容。语句三：选择每一年中最高的气温。根据得到的信息，hive中的sql操作是使用mapredu 阅读全文

posted @ 2012-07-03 11:09 kasuosuo 阅读(2722) 评论(0) 推荐(0) 编辑

Hive和传统数据库的比较（转载）

摘要：由于 Hive 采用了 SQL 的查询语言 HQL，因此很容易将 Hive 理解为数据库。其实从结构上来看，Hive 和数据库除了拥有类似的查询语言，再无类似之处。本文将从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用中，但是Hive 是为数据仓库而设计的，清楚这一点，有助于从应用角度理解 Hive 的特性。Hive 和数据库的比较查询语言HQLSQL数据存储位置HDFSRaw Device 或者 Local FS数据格式用户定义系统决定数据更新不支持支持索引无有执行MapRedcueExecutor执行延迟高低可扩展性高低数据规模大小查询语言。由于 SQL 被阅读全文

posted @ 2012-07-03 09:53 kasuosuo 阅读(815) 评论(0) 推荐(0) 编辑

2012年6月21日

Hadoop-1.0.3和hbase-0.92.1整合安装

摘要： 1. 最初接触hadoop的时候使用的版本是0.20.2,现在2.0版本都出了。当时搭建过一个hadoop0.20.2和hbase0.20.6的集群环境，现在为了测试学习的方便，主备搭建一个伪分布式环境，使用Hadoop-1.0.3和hbase-0.92.1。2. 首先需要做的是对以前hadoop的升级，从0.20.2升级到1.0.3。升级过程如下所示：下面红字部分转自：http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465649.html1.运行dfsadmin -upgradeProgress status 检查是否存在备份如. 阅读全文

posted @ 2012-06-21 23:46 kasuosuo 阅读(3145) 评论(0) 推荐(0) 编辑

2012年6月20日

转载“Hadoop 和DBMS 的互补性”

摘要：随着Microsoft 也加入Hadoop 阵营，Hadoop 已经完全变成了DBMS 的好朋友了 , 2年之前的SIGMOD组织提出的“A Comparison of Approaches to Large-Scale Data Analysis”引发了关于并行数据库和MapReduce模型的讨论，双方唇枪舌剑之后发现两个系统根本就是各有所长, DBMS 目前有些处理好的领域和商业支持，Hadoop 也有自己的优势和使用案例. 就如前一篇TDWI 所说的3个V 问题，新一代Hadoop MapReduce 主要解决的是数据容量和多种类型的数据（结构化，半结构化，非结构化）. 而传统的MP. 阅读全文

posted @ 2012-06-20 13:04 kasuosuo 阅读(315) 评论(0) 推荐(0) 编辑

2012年6月19日

Effective C++学习笔记1

摘要：一. 让自己习惯C++1. 视C++为一个语言联邦 C++主要包括以下四个部分： C：C++以C为基础，并兼容C。 Object-Oriented C++：面向对象编程，主要包括：类，封装，继承，多态。 Template C++：C++泛型编程（C++ Generic Programming）。 STL：主要包括：容器，迭代器，算法，函数对象。 C++高效编程守则视情况而变化，取决于你使用哪一部分C++。2. 尽量使用const，enum，inline替换define （1）const定义的常量在编译期确定，因此可以作为数组定义时使用。（2）在class中只能... 阅读全文

posted @ 2012-06-19 23:36 kasuosuo 阅读(331) 评论(0) 推荐(0) 编辑

2012年6月18日

由前序遍历和中序遍历重建二叉树

摘要：编程之美3.9：给出前序遍历和中序遍历，重新创建二叉树，后序遍历输出。代码如下：View Code 1 #include <iostream> 2 #include <cassert> 3 4 using namespace std; 5 6 struct Node 7 { 8 Node* m_lChild; 9 Node* m_rChild; 10 char data; 11 }; 12 13 void AfterTra(Node* pRoot) 14 { 15 if (!pRoot) 16 { 17 retu... 阅读全文

posted @ 2012-06-18 22:34 kasuosuo 阅读(985) 评论(0) 推荐(0) 编辑

一尾鱼

一只无聊的程序猿

公告