风-fmgao

导航

2019年2月22日

Java虚拟机------JVM介绍

摘要: Java平台和语言最开始只是SUN公司在1990年12月开始研究的一个内部项目: Java的平台无关性 Java平台和语言最开始只是SUN公司在1990年12月开始研究的一个内部项目[stealth 秘密行动],主要研究:交互式电视、烤面包箱等微型系统.Sun内部人员把这个项目称为Green Jam 阅读全文

posted @ 2019-02-22 14:30 风-fmgao 阅读(340) 评论(0) 推荐(0) 编辑

Java虚拟机------JVM内存区域

摘要: JVM内存区域运行时数据区域分为两种: JVM内存区域 运行时数据区域分为两种: 线程隔离的数据区: 程序计数器 Java虚拟机栈 本地方法栈 所有线程程共享的数据区: Java堆 方法区 Java堆 方法区 JVM 内存区域 ———栈介绍 所谓 “栈”包括:Java虚拟机栈,本地方法栈,他们的作用 阅读全文

posted @ 2019-02-22 14:29 风-fmgao 阅读(170) 评论(0) 推荐(0) 编辑

Java虚拟机------垃圾收集器

摘要: JVM系列最核心的文章没有之一: 引用 强引用 只要引用存在,垃圾回收器就永远不会回收。当内存空足,Java虚拟机宁愿抛出OutOfMemoryError //可直接通过obj取得对应的对象 如obj.equels(new Object()); 而这样 obj对象对后面new Object的一个强引 阅读全文

posted @ 2019-02-22 14:26 风-fmgao 阅读(388) 评论(0) 推荐(0) 编辑

Java虚拟机--------JVM常见参数

摘要: JVM 调优常见参数 JVM 学习思路 阅读全文

posted @ 2019-02-22 14:20 风-fmgao 阅读(362) 评论(0) 推荐(0) 编辑

Kafka和的安装与配置

摘要: 本文主要介绍Kafka的安装与配置: 集群规划 datanode1datanode2datanode3 zk zk zk kafka kafka kafka kafka jar包下载地址 http://kafka.apache.org/downloads.html kafka集群安装部署 解压安装包 阅读全文

posted @ 2019-02-22 14:11 风-fmgao 阅读(413) 评论(0) 推荐(0) 编辑

Kafka介绍与消息队列

摘要: 消息队列的好处: 消息队列(Message Queue) 消息: 网络中的两台计算机或者两个通讯设备之间传递的数据。例如说:文本、音乐、视频等内容。 队列:一种特殊的线性表(数据元素首尾相接),特殊之处在于只允许在首部删除元素和在尾部追加元素。入队、出队。 消息队列:顾名思义,消息+队列,保存消息的 阅读全文

posted @ 2019-02-22 14:03 风-fmgao 阅读(468) 评论(0) 推荐(0) 编辑

Kafka命令操作

摘要: 本文主要介绍Kafka的shell命令: 查看当前服务器所有的topic 创建topic 删除topic 创建生产者发送消息 创建消费者接受消息 查看某一个topic的详情 阅读全文

posted @ 2019-02-22 14:02 风-fmgao 阅读(144) 评论(0) 推荐(0) 编辑

Kafka深度解析

摘要: Kafka技术内幕笔记: 分区模型 Kafka集群向多个消息代理服务器(brokerserver)组成,发布至Kafka集群的每条消息都有一个类别,用主题(topic)来表示。不同类型的数据,可以设置不同的主题。一个主题一般会有多个消息的订阅者,当生产者发布消息到某个主题时,订阅了这个主题的消费者都 阅读全文

posted @ 2019-02-22 14:00 风-fmgao 阅读(574) 评论(0) 推荐(0) 编辑

Flume架构

摘要: Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统: Flume 介绍 Flume是由cloudera软件公司产出的高可用、高可靠、分布式的海量日志收集系统、聚合和传输的系统、于2009年被捐赠了apache软件基金会,为Hadoop相关组件之一。Flu 阅读全文

posted @ 2019-02-22 13:58 风-fmgao 阅读(525) 评论(0) 推荐(0) 编辑

Hive

摘要: Hive的基本概念: Hive 简介 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门 阅读全文

posted @ 2019-02-22 13:52 风-fmgao 阅读(295) 评论(0) 推荐(0) 编辑

Hadoop简介与分布式安装

摘要: Hadoop的基本概念和分布式安装: Hadoop 简介 Hadoop 是Apache Lucene创始人道格·卡丁(Doug Cutting)创建的,Lucene是一个应用广泛的文本搜索库,Hadoop起源于开源网络搜索引擎Apache Nutch,后者是Lucene项目的一部分. Apache 阅读全文

posted @ 2019-02-22 13:33 风-fmgao 阅读(219) 评论(0) 推荐(0) 编辑

Hadoop分布式文件系统HDFS

摘要: HDFS的探究: HDFS HDFS是 Hadoop Distribute File System的缩写,是谷歌GFS分布式文件系统的开源实现,Apache Hadoop的一个子项目,HDFS基于流数据访问模式的分布式文件系统,支持海量数据的存储,允许用户将百千台组成存储集群,HDFS运行在低成本的 阅读全文

posted @ 2019-02-22 11:29 风-fmgao 阅读(987) 评论(0) 推荐(0) 编辑

HDFS的操作SHELL和API

摘要: HDFS的shell操作和JavaAPI的使用: WEB WEB端口50090查看SecondaryNameNode信息。可以查看Hadoop的版本,NameNode的IP,Checkpoint等信息。 WEB端口50070可以查看HDFS的信息和目录结构 SHELL 查看 创建文件夹 新建文件 查 阅读全文

posted @ 2019-02-22 11:24 风-fmgao 阅读(476) 评论(0) 推荐(0) 编辑

HDFS高级功能

摘要: HDFS的六大高级特性: 安全模式 安全模式是HDFS所处的一种特殊状态,在这种状态下,文件系统只接受读数据请求,而不接受删除、修改等变更请求。在NameNode主节点启动时,HDFS首先进入安全模式,DataNode在启动的时候会向namenode汇报可用的block等状态,让NameNode得到 阅读全文

posted @ 2019-02-22 11:16 风-fmgao 阅读(773) 评论(0) 推荐(0) 编辑

Hadoop的I/O操作

摘要: Hadoop的IO: Hadoop自带的一条原子操作作用域数据I/O操作,其中有一些技术比Hadoop更常用,如数据完整性保持和压缩在处理好几个TB级别的数据集时值得关注. 数据完整性 Hadoop用户不希望在存储和处理数据时丢失或损坏任何数据,但是当系统中需要处理数据量达到Hadoop处理极限时, 阅读全文

posted @ 2019-02-22 11:02 风-fmgao 阅读(600) 评论(0) 推荐(0) 编辑

Hadoop的RPC工作原理

摘要: RPC远程过程调用: Hadoop的远程过程调用(Remote Procedure Call,RPC)是Hadoop中核心通信机制,RPC主要通过所有Hadoop的组件元数据交换,如MapReduce、Hadoop分布式文件系统(HDFS)和Hadoop的数据库(Hbase)。RPC是一种通过网络从 阅读全文

posted @ 2019-02-22 10:56 风-fmgao 阅读(1223) 评论(0) 推荐(0) 编辑

Mapreduce入门和优化方案

摘要: MapReduce基本原理和高性能网络下优化: Mapreduce概述 Mapreduce式谷歌开源的一项重要技术,是一个编程模型,用来进行大数据量的计算,对于大数据量的计算通常采用的处理方式式并行计算,对于许多开发者来说,自己完全实现一个并行计算程序难度太大.而MapReduce就是一种简化并行计 阅读全文

posted @ 2019-02-22 10:39 风-fmgao 阅读(1822) 评论(0) 推荐(0) 编辑

MapReduce的工作机制

摘要: 《Hadoop权威指南》中的MapReduce工作机制和Shuffle: 框架 Hadoop2.x引入了一种新的执行机制MapRedcue 2。这种新的机制建议在Yarn的系统上,目前用于执行的框架可以通过mapreduce.framework.name属性进行设置,值“local“表示本地作业运行 阅读全文

posted @ 2019-02-22 10:38 风-fmgao 阅读(570) 评论(0) 推荐(0) 编辑

MapReduce源码刨析

摘要: MapReduce编程刨析: Map map函数是对一些独立元素组成的概念列表(如单词计数中每行数据形成的列表)的每一个元素进行指定的操作(如把每行数据拆分成不同单词,并把每个单词计数为1),用户可以自定义一个把数据拆分成不同单词并把单词计数为1的映射map函数),事实上每个元素都是被独立操作的,而 阅读全文

posted @ 2019-02-22 10:29 风-fmgao 阅读(249) 评论(0) 推荐(0) 编辑

MapReduce高级编程

摘要: MapReduce 计数器、最值: 计数器 数据集在进行MapReduce运算过程中,许多时候,用户希望了解待分析的数据的运行的运行情况。Hadoop内置的计数器功能收集作业的主要统计信息,可以帮助用户理解程序的运行情况,辅助用户诊断故障。 这些记录了该程序运行过程的的一些信息的计数,如Map in 阅读全文

posted @ 2019-02-22 10:09 风-fmgao 阅读(325) 评论(0) 推荐(0) 编辑