##云计算与大数据 - 随笔分类 - 菜鸟-传奇

摘要：FusionInsight大数据开发 Flink应用开发阅读全文

posted @ 2021-04-06 13:39 菜鸟-传奇阅读(116) 评论(0) 推荐(0) 编辑

摘要：Hbase的配置与使用设置环境变量 vim /etc/profile export HBASE_HOME=/usr/local/hbase export PATH=$PATH:/usr/local/hbase/bin source /etc/profile 设置Hbase的配置文件 cd /usr 阅读全文

posted @ 2021-01-19 21:57 菜鸟-传奇阅读(368) 评论(0) 推荐(0) 编辑

大数据Hadoop的安装与使用

摘要：大数据Hadoop的安装与使用链接：https://pan.baidu.com/s/12vFNRLPJ9zGA2LTJuIpxJQ 提取码：83fb Vmware的安装：https://www.cnblogs.com/cainiao-chuanqi/p/13130663.html 虚拟机的导入：h 阅读全文

posted @ 2020-12-03 18:15 菜鸟-传奇阅读(834) 评论(0) 推荐(0) 编辑

Ubuntu kylin优麒麟下配置Hive环境

摘要：Ubuntu kylin优麒麟下配置Hive环境 Hive简介什么是Hivehive是基于Hadoop的一个数据仓储工具，可以将结构化的数据文件映射为一张数据表，并提供SQL查询功能，可以将SQL语句转化为MapReduce任务进行执行。hive是基于Hadoop的一个数据仓储工具，可以将结构化的阅读全文

posted @ 2020-11-03 15:09 菜鸟-传奇阅读(492) 评论(0) 推荐(0) 编辑

Ubuntu kylin优麒麟下配置Hadoop环境

摘要：Ubuntu kylin优麒麟下配置Hadoop环境查看JDK目录 cd /usr/lib/jvm/java-8-openjdk-amd64 查看Hadoop目录 cd /usr/local/hadoop 查看IP地址 ifconfig ssh服务开启（如果没有开启） Linux系统的ssh要打开阅读全文

posted @ 2020-10-23 17:41 菜鸟-传奇阅读(654) 评论(0) 推荐(0) 编辑

Ubuntu kylin优麒麟root用户与静态网络设置

摘要：Ubuntu kylin优麒麟root用户与静态网络设置优麒麟（Ubuntu Kylin）是由麒麟软件有限公司和CCN开源软件创新联合实验室主导开发的全球开源项目，其宗旨是通过研发用户友好的桌面环境以及特定需求的应用软件；优麒麟操作系统是 Ubuntu 官方衍生版，得到来自Debian、Ubu 阅读全文

posted @ 2020-10-13 14:54 菜鸟-传奇阅读(3176) 评论(0) 推荐(0) 编辑

在Vmware中Centos下的Hadoop环境搭建

摘要：Hadoop环境搭建 hadoo和jdk的下载问题：如果是下载到windows上，需要移动到虚拟机上。只需直接拖拽就可以完成文件的移动。如果没能拖拽成功，则需要使用远程连接的软件来完成文件的上传，这里推荐使用MobaXterm的安装和使用：https://www.cnblogs.com/cainia 阅读全文

posted @ 2020-10-08 10:04 菜鸟-传奇阅读(848) 评论(0) 推荐(0) 编辑

大数据知识梳理（Hadoop、HDFS）（整理中。。。）

摘要：大数据知识梳理（Hadoop、HDFS）（更新中。。。）第1讲大数据概述1.1 大数据时代1.2 大数据概念和影响1.3 大数据的应用1.4 大数据的关键技术1.5 大数据与云计算、物联网第2讲大数据处理架构Hadoop2.1 概述2.2 Hadoop项目结构2.3 Hadoop的安装与使用阅读全文

posted @ 2020-09-18 09:48 菜鸟-传奇阅读(1279) 评论(0) 推荐(0) 编辑

大数据知识梳理（整理中。。。）

摘要：大数据知识梳理（整理中。。。）一、大数据概述大数据的特征（4V）： 1、Volume，数据量大 2、Variety，数据类型多大数据由结构化和非结构化数据组成： 10%的结构化数据，存储在数据库中； 90%的非结构化数据，与人类信息密切相关。 3、Velocity，处理速度快 4、Value，阅读全文

posted @ 2020-09-18 08:38 菜鸟-传奇阅读(4877) 评论(1) 推荐(3) 编辑

大数据知识梳理（大数据发展）（整理中。。。）

摘要：大数据知识梳理（整理中。。。）数据化浪潮第一次 pc 第二次移动第三次大数据物联网促进价格数据的产量（存储不舍得删之前每年删一次）摩尔定律大数据的时代第一阶段沃尔玛数据库商店的记录萌芽第二阶段博客微博：有限的数据发展第三阶段感知系统的阶段物联网的阅读全文

posted @ 2020-09-15 16:00 菜鸟-传奇阅读(316) 评论(0) 推荐(0) 编辑

Java API操作上传文件

摘要：因为Hadoop中关于文件操作类基本上都在“org.apache.hadoop.fs”包中，这些API的主要作用主要体现在以下操作上：打开文件、读写文件、删除文件。并且，Hadoop类库中最终面向用户提供的接口类是FileSystem，该类是一个抽象类，只能通过get方法得到。下面，笔者就逐一的对阅读全文

posted @ 2020-04-28 17:45 菜鸟-传奇阅读(1089) 评论(0) 推荐(1) 编辑

解释一下什么是网盘与云盘

摘要：解释一下什么是网盘与云盘网盘网盘：又称网络U盘、网络硬盘，是由互联网公司推出的在线存储服务，服务器机房为用户划分一定的磁盘空间，为用户免费或收费提供文件的存储、访问、备份、共享等文件管理等功能，并且拥有高级的世界各地的容灾备份。用户可以把网盘看成一个放在网络上的硬盘或U盘，不管你是在家中、单位或阅读全文

posted @ 2020-01-10 15:36 菜鸟-传奇阅读(2215) 评论(0) 推荐(2) 编辑

大数据各个组件对外接口类型

摘要：大数据各个组件对外接口类型组件名安全模式支持的接口类型普通模式支持的接口类型 Elasticsearch JAVA、REST JAVA、REST Flink CLI、JAVA、Scala、REST CLI、JAVA、Scala、REST Flume JAVA JAVA GraphBase CL 阅读全文

posted @ 2019-12-24 15:39 菜鸟-传奇阅读(940) 评论(0) 推荐(0) 编辑

FusionInsight HD组件介绍

摘要：FusionInsight HD组件介绍 FusionInsight系统的整体逻辑架构图如下所示： FusionInsight HD 对开源组件进行封装和增强，对外提供稳定的大容量的数据存储、查询和分析能力。各自组件提供功能如下： Manager：作为运维系统，为FusionInsight HD提阅读全文

posted @ 2019-12-24 14:28 菜鸟-传奇阅读(6292) 评论(0) 推荐(2) 编辑

Hive与HBase的区别与联系

摘要：Hive与HBase的区别与联系二者区别 Hive：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能。 Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表纯逻辑。hive需要用到hdfs存储文件，阅读全文

posted @ 2019-12-22 17:34 菜鸟-传奇阅读(13862) 评论(0) 推荐(12) 编辑

介绍一下什么是“云计算”

摘要：介绍一下什么是“云计算” 云计算：把物理资源以服务的方式提供给用户使用。现阶段广为接受的是美国国家标准与技术研究院（NIST）定义：云计算，是一种按使用量付费的模式，这种模式提供可用的、便捷的、按需的网络访问，进入可以配置的计算资源共享池（资源包括网络，服务器，存储，应用软件，服务)，这些资源能阅读全文

posted @ 2019-12-13 20:24 菜鸟-传奇阅读(864) 评论(0) 推荐(4) 编辑

RAID（独立磁盘冗余阵列）简介

摘要：RAID（独立磁盘冗余阵列）在大数据技术出现之前，人们就需要面对这些关于存储的问题，对应的解决方案就是RAID技术。 RAID 等级 RAID0 RAID1 RAID3 RAID5 RAID6 RAID10 别名条带镜像专用奇偶校验条带分布奇偶校验条带双重奇偶校验条带镜像加条带容错性阅读全文

posted @ 2019-08-30 16:08 菜鸟-传奇阅读(3634) 评论(0) 推荐(1) 编辑

大数据基础总结---MapReduce和YARN技术原理

摘要：Map Reduce和YARN技术原理学习目标熟悉MapReduce和YARN是什么掌握MapReduce使用的场景及其原理掌握MapReduce和YARN功能与架构熟悉YARN的新特性 MapReduce的概述 MapReduce基于Google发布的MapReduce论文设计开发，用于阅读全文

posted @ 2019-08-30 15:24 菜鸟-传奇阅读(1927) 评论(0) 推荐(3) 编辑

大数据基础总结---HDFS分布式文件系统

摘要：HDFS分布式文件系统文件系统的基本概述文件系统定义：文件系统是一种存储和组织计算机数据的方法，它使得对其访问和查找变得容易。文件名：在文件系统中，文件名是用于定位存储位置。元数据（Metadata）：保存文件属性的数据，如文件名，文件长度，文件所属用户组，文件存储位置等。数据块（Bloc 阅读全文

posted @ 2019-08-27 19:57 菜鸟-传奇阅读(9080) 评论(0) 推荐(8) 编辑

HDFS 其他命令---fsck

摘要：HDFS 其他命令 HDFS支持fsck命令用以检查各种不一致。fsck用以报告各种文件问题，如 block丢失或缺少block等。fack 命令用法如下： hdfs fsck <path> [-move | -delete | -openforwrite] [-files [-blocks [-l 阅读全文

posted @ 2019-07-30 10:43 菜鸟-传奇阅读(946) 评论(0) 推荐(0) 编辑

菜鸟-传奇

愿路途漫长，以后莫失莫忘。愿你不骄不躁，安稳顺心。

随笔分类 - ##云计算与大数据

公告

搜索

我的标签

积分与排名

随笔分类 (518)

文章分类 (24)

阅读排行榜

评论排行榜

推荐排行榜