摘要:
一,KETTLE介绍 Kettle是 (Extract, Transform and Load抽取、转换、加载)一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。其中,Spoon是Kettle中的一个组件,其他组件有PAN,CHEF,Encr 阅读全文
摘要:
Hadoop 分为两大块:HDFS 和 MapReduce HDFS是一个分布式存储文件系统,Mapreduce是一个分布式计算的框架,两者结合起来,就可以很容易做一些分布式处理任务了。 一 安装JDK1.7 Linux会自带JDK,如果不使用自带版本的话需要卸载。 1. 卸载系统自带的jdk版本 阅读全文
摘要:
由于本机是 win 10的家庭版本的操作系统,没有Hyper-V,在控制面板 -> 程序 -> 启用或关闭Windows功能 -> 没有找到Hyper-V。所以就在虚拟机中使用yum源现在安装docker。 我的虚拟机是red hat 6.5 64位,需要配置的是CentOS-6的yum源,red 阅读全文
摘要:
一.连接数据库 2 启动 gpfdist 启动过程: 把数据文件.dat拖入linux下,存放在 /home/gpadmin/gptestdata / 目录下 创建外部表成功 创建加载目标表: 加载数据: 客户端查看数据: 问题一: 解决办法:错误原因是之前在启动gpfdist的时候已经写了 -d 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
执行SQL语句的方式 1.交互方式psql mydatabasemydatabase=# SELECT * FROM table;2. 非交互方式 (单行命令)psql mydatabase –c “SELECT * FROM table;”3. 非交互方式 (多行命令)psql mydatab 阅读全文
摘要:
一..bash_profile环境变量不生效解决办法() 每次重新打开新的终端,就不能连接postgres数据库,不能联通segment节点, 比较笨的办法是每次打开新的终端就执行下 # source .bash_profile (让环境变量生效) 如果在startX下打开一个console要读取配 阅读全文