2019 年 2月 22 日随笔档案 - 风-fmgao

Java虚拟机------JVM介绍

摘要： Java平台和语言最开始只是SUN公司在1990年12月开始研究的一个内部项目： Java的平台无关性 Java平台和语言最开始只是SUN公司在1990年12月开始研究的一个内部项目[stealth 秘密行动],主要研究：交互式电视、烤面包箱等微型系统.Sun内部人员把这个项目称为Green Jam 阅读全文

posted @ 2019-02-22 14:30 风-fmgao 阅读(340) 评论(0) 推荐(0) 编辑

Java虚拟机------JVM内存区域

摘要： JVM内存区域运行时数据区域分为两种： JVM内存区域运行时数据区域分为两种: 线程隔离的数据区: 程序计数器 Java虚拟机栈本地方法栈所有线程程共享的数据区: Java堆方法区 Java堆方法区 JVM 内存区域 ———栈介绍所谓 “栈”包括:Java虚拟机栈,本地方法栈,他们的作用阅读全文

posted @ 2019-02-22 14:29 风-fmgao 阅读(170) 评论(0) 推荐(0) 编辑

Java虚拟机------垃圾收集器

摘要： JVM系列最核心的文章没有之一：引用强引用只要引用存在,垃圾回收器就永远不会回收。当内存空足，Java虚拟机宁愿抛出OutOfMemoryError //可直接通过obj取得对应的对象如obj.equels(new Object()); 而这样 obj对象对后面new Object的一个强引阅读全文

posted @ 2019-02-22 14:26 风-fmgao 阅读(388) 评论(0) 推荐(0) 编辑

Java虚拟机--------JVM常见参数

摘要： JVM 调优常见参数 JVM 学习思路阅读全文

posted @ 2019-02-22 14:20 风-fmgao 阅读(362) 评论(0) 推荐(0) 编辑

Kafka和的安装与配置

摘要：本文主要介绍Kafka的安装与配置：集群规划 datanode1datanode2datanode3 zk zk zk kafka kafka kafka kafka jar包下载地址 http://kafka.apache.org/downloads.html kafka集群安装部署解压安装包阅读全文

posted @ 2019-02-22 14:11 风-fmgao 阅读(413) 评论(0) 推荐(0) 编辑

Kafka介绍与消息队列

摘要：消息队列的好处：消息队列（Message Queue）消息: 网络中的两台计算机或者两个通讯设备之间传递的数据。例如说：文本、音乐、视频等内容。队列：一种特殊的线性表（数据元素首尾相接），特殊之处在于只允许在首部删除元素和在尾部追加元素。入队、出队。消息队列：顾名思义，消息+队列，保存消息的阅读全文

posted @ 2019-02-22 14:03 风-fmgao 阅读(468) 评论(0) 推荐(0) 编辑

Kafka命令操作

摘要：本文主要介绍Kafka的shell命令：查看当前服务器所有的topic 创建topic 删除topic 创建生产者发送消息创建消费者接受消息查看某一个topic的详情阅读全文

posted @ 2019-02-22 14:02 风-fmgao 阅读(144) 评论(0) 推荐(0) 编辑

Kafka深度解析

摘要： Kafka技术内幕笔记：分区模型 Kafka集群向多个消息代理服务器（brokerserver）组成，发布至Kafka集群的每条消息都有一个类别，用主题（topic）来表示。不同类型的数据，可以设置不同的主题。一个主题一般会有多个消息的订阅者，当生产者发布消息到某个主题时，订阅了这个主题的消费者都阅读全文

posted @ 2019-02-22 14:00 风-fmgao 阅读(574) 评论(0) 推荐(0) 编辑

Flume架构

摘要： Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统： Flume 介绍 Flume是由cloudera软件公司产出的高可用、高可靠、分布式的海量日志收集系统、聚合和传输的系统、于2009年被捐赠了apache软件基金会，为Hadoop相关组件之一。Flu 阅读全文

posted @ 2019-02-22 13:58 风-fmgao 阅读(525) 评论(0) 推荐(0) 编辑

Hive

摘要： Hive的基本概念： Hive 简介 hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门阅读全文

posted @ 2019-02-22 13:52 风-fmgao 阅读(295) 评论(0) 推荐(0) 编辑

Hadoop简介与分布式安装

摘要： Hadoop的基本概念和分布式安装： Hadoop 简介 Hadoop 是Apache Lucene创始人道格·卡丁(Doug Cutting)创建的,Lucene是一个应用广泛的文本搜索库,Hadoop起源于开源网络搜索引擎Apache Nutch,后者是Lucene项目的一部分. Apache 阅读全文

posted @ 2019-02-22 13:33 风-fmgao 阅读(219) 评论(0) 推荐(0) 编辑

Hadoop分布式文件系统HDFS

摘要： HDFS的探究： HDFS HDFS是 Hadoop Distribute File System的缩写，是谷歌GFS分布式文件系统的开源实现，Apache Hadoop的一个子项目，HDFS基于流数据访问模式的分布式文件系统，支持海量数据的存储，允许用户将百千台组成存储集群，HDFS运行在低成本的阅读全文

posted @ 2019-02-22 11:29 风-fmgao 阅读(987) 评论(0) 推荐(0) 编辑

HDFS的操作SHELL和API

摘要： HDFS的shell操作和JavaAPI的使用： WEB WEB端口50090查看SecondaryNameNode信息。可以查看Hadoop的版本，NameNode的IP，Checkpoint等信息。 WEB端口50070可以查看HDFS的信息和目录结构 SHELL 查看创建文件夹新建文件查阅读全文

posted @ 2019-02-22 11:24 风-fmgao 阅读(476) 评论(0) 推荐(0) 编辑

HDFS高级功能

摘要： HDFS的六大高级特性：安全模式安全模式是HDFS所处的一种特殊状态，在这种状态下，文件系统只接受读数据请求，而不接受删除、修改等变更请求。在NameNode主节点启动时，HDFS首先进入安全模式，DataNode在启动的时候会向namenode汇报可用的block等状态，让NameNode得到阅读全文

posted @ 2019-02-22 11:16 风-fmgao 阅读(773) 评论(0) 推荐(0) 编辑

Hadoop的I/O操作

摘要： Hadoop的IO： Hadoop自带的一条原子操作作用域数据I/O操作,其中有一些技术比Hadoop更常用,如数据完整性保持和压缩在处理好几个TB级别的数据集时值得关注. 数据完整性 Hadoop用户不希望在存储和处理数据时丢失或损坏任何数据，但是当系统中需要处理数据量达到Hadoop处理极限时，阅读全文

posted @ 2019-02-22 11:02 风-fmgao 阅读(600) 评论(0) 推荐(0) 编辑

Hadoop的RPC工作原理

摘要： RPC远程过程调用： Hadoop的远程过程调用(Remote Procedure Call,RPC)是Hadoop中核心通信机制，RPC主要通过所有Hadoop的组件元数据交换，如MapReduce、Hadoop分布式文件系统(HDFS)和Hadoop的数据库(Hbase)。RPC是一种通过网络从阅读全文

posted @ 2019-02-22 10:56 风-fmgao 阅读(1223) 评论(0) 推荐(0) 编辑

Mapreduce入门和优化方案

摘要： MapReduce基本原理和高性能网络下优化： Mapreduce概述 Mapreduce式谷歌开源的一项重要技术,是一个编程模型,用来进行大数据量的计算,对于大数据量的计算通常采用的处理方式式并行计算,对于许多开发者来说,自己完全实现一个并行计算程序难度太大.而MapReduce就是一种简化并行计阅读全文

posted @ 2019-02-22 10:39 风-fmgao 阅读(1822) 评论(0) 推荐(0) 编辑

MapReduce的工作机制

摘要：《Hadoop权威指南》中的MapReduce工作机制和Shuffle：框架 Hadoop2.x引入了一种新的执行机制MapRedcue 2。这种新的机制建议在Yarn的系统上，目前用于执行的框架可以通过mapreduce.framework.name属性进行设置，值“local“表示本地作业运行阅读全文

posted @ 2019-02-22 10:38 风-fmgao 阅读(570) 评论(0) 推荐(0) 编辑

MapReduce源码刨析

摘要： MapReduce编程刨析： Map map函数是对一些独立元素组成的概念列表(如单词计数中每行数据形成的列表)的每一个元素进行指定的操作(如把每行数据拆分成不同单词,并把每个单词计数为1),用户可以自定义一个把数据拆分成不同单词并把单词计数为1的映射map函数),事实上每个元素都是被独立操作的,而阅读全文

posted @ 2019-02-22 10:29 风-fmgao 阅读(249) 评论(0) 推荐(0) 编辑

MapReduce高级编程

摘要： MapReduce 计数器、最值：计数器数据集在进行MapReduce运算过程中，许多时候，用户希望了解待分析的数据的运行的运行情况。Hadoop内置的计数器功能收集作业的主要统计信息，可以帮助用户理解程序的运行情况，辅助用户诊断故障。这些记录了该程序运行过程的的一些信息的计数，如Map in 阅读全文

posted @ 2019-02-22 10:09 风-fmgao 阅读(325) 评论(0) 推荐(0) 编辑

风-fmgao

导航

公告