随笔分类 -  Hadoop

摘要:FastDFS是用C语言编写的一款开源的轻量级分布式文件系统。它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。 FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、 阅读全文
posted @ 2018-01-15 08:38 欢醉 阅读(10617) 评论(0) 推荐(1) 编辑
摘要:前面介绍了sqoop1.4.6的 如何将mysql数据导入Hadoop之Sqoop安装,下面就介绍两者间的数据互通的简单使用命令。 显示mysql数据库的信息,一般sqoop安装测试用 显示数据库里所有表: mysql导入到hdfs中 sqoop ##sqoop命令import ##表示导入--co 阅读全文
posted @ 2017-06-26 08:42 欢醉 阅读(4899) 评论(0) 推荐(0) 编辑
摘要:Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库 阅读全文
posted @ 2017-06-23 09:00 欢醉 阅读(5917) 评论(3) 推荐(2) 编辑
摘要:Hadoop的编程可以是在Linux环境或Winows环境中,在此以Windows环境为示例,以Eclipse工具为主(也可以用IDEA)。网上也有很多开发的文章,在此也参考他们的内容只作简单的介绍和要点总结。 Hadoop是一个强大的并行框架,它允许任务在其分布式集群上并行处理。但是编写、调试Ha 阅读全文
posted @ 2017-05-17 08:43 欢醉 阅读(3104) 评论(0) 推荐(2) 编辑
摘要:经过一系列的前期环境准备,现在可以开始Hadoop的安装了,在这里去apache官网下载2.7.3的版本 http://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz 不需要下载最新的3.0版本 阅读全文
posted @ 2017-05-10 08:56 欢醉 阅读(1468) 评论(0) 推荐(2) 编辑
摘要:由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知识介绍。 VMware的安装,装好一个虚拟机后利用复制虚拟机的方式创建后面几个虚拟机,省时省力,需要 阅读全文
posted @ 2017-05-08 08:42 欢醉 阅读(830) 评论(0) 推荐(2) 编辑
摘要:在互联网的世界中数据都是以TB、PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数据分析,学习,如双十一淘宝的交易量的实时展示。 大数据什么叫大?4个特征: 体量化 Volume,就是量大。 多样化 Variety,可能是结构 阅读全文
posted @ 2017-05-03 08:54 欢醉 阅读(6780) 评论(3) 推荐(2) 编辑

点击右上角即可分享
微信分享提示