2014 年 7月随笔档案 - mumuxinfei

Thrift 个人实战--Thrift RPC服务框架日志的优化

摘要：前言: Thrift作为Facebook开源的RPC框架, 通过IDL中间语言, 并借助代码生成引擎生成各种主流语言的rpc框架服务端/客户端代码. 不过Thrift的实现, 简单使用离实际生产环境还是有一定距离, 本系列将对Thrift作代码解读和框架扩充, 使得它更加贴近生产环境. 本文讲述... 阅读全文

posted @ 2014-07-31 21:46 mumuxinfei 阅读(6292) 评论(1) 推荐(5) 编辑

Thrift 个人实战--Thrift 服务化 Client的改造

摘要：前言: Thrift作为Facebook开源的RPC框架, 通过IDL中间语言, 并借助代码生成引擎生成各种主流语言的rpc框架服务端/客户端代码. 不过Thrift的实现, 简单使用离实际生产环境还是有一定距离, 本系列将对Thrift作代码解读和框架扩充, 使得它更加贴近生产环境. 本文主要讲... 阅读全文

posted @ 2014-07-31 15:03 mumuxinfei 阅读(7906) 评论(0) 推荐(5) 编辑

Thrift 个人实战--Thrift 的序列化机制

摘要：前言: Thrift作为Facebook开源的RPC框架, 通过IDL中间语言, 并借助代码生成引擎生成各种主流语言的rpc框架服务端/客户端代码. 不过Thrift的实现, 简单使用离实际生产环境还是有一定距离, 本系列将对Thrift作代码解读和框架扩充, 使得它更加贴近生产环境. 本文主要... 阅读全文

posted @ 2014-07-30 15:21 mumuxinfei 阅读(5634) 评论(0) 推荐(3) 编辑

Thrift 个人实战--Thrift 网络服务模型

摘要：前言: Thrift作为Facebook开源的RPC框架, 通过IDL中间语言, 并借助代码生成引擎生成各种主流语言的rpc框架服务端/客户端代码. 不过Thrift的实现, 简单使用离实际生产环境还是有一定距离, 本系列将对Thrift作代码解读和框架扩充, 使得它更加贴近生产环境. 本文主要... 阅读全文

posted @ 2014-07-29 14:51 mumuxinfei 阅读(5549) 评论(5) 推荐(7) 编辑

Thrift 个人实战--初次体验Thrift

摘要：前言: Thrift作为Facebook开源的RPC框架, 通过IDL中间语言, 并借助代码生成引擎生成各种主流语言的rpc框架服务端/客户端代码. 不过Thrift的实现, 简单使用离实际生产环境还是有一定距离, 本系列将对Thrift作代码解读和框架扩充, 使得它更加贴近生产环境. 本文主要... 阅读全文

posted @ 2014-07-28 20:48 mumuxinfei 阅读(2933) 评论(10) 推荐(4) 编辑

HBase 实战(2)--时间序列检索和面检索的应用场景实战

摘要：前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇主要讲述面向时间序列/面检索的应用场景时, 如何利用HBase的特性去处理和优化. 构造应用场景某气象局对各个站点... 阅读全文

posted @ 2014-07-26 14:54 mumuxinfei 阅读(2899) 评论(0) 推荐(1) 编辑

Kafka实战系列--Kafka API使用体验

摘要：前言: kafka是linkedin开源的消息队列, 淘宝的metaq就是基于kafka而研发. 而消息队列作为一个分布式组件, 在服务解耦/异步化, 扮演非常重要的角色. 本系列主要研究kafka的思想和使用, 本文主要讲解kafka的一些基本概念和api的使用. *) 准备工作1) 配置ma... 阅读全文

posted @ 2014-07-22 16:00 mumuxinfei 阅读(6306) 评论(0) 推荐(0) 编辑

Kafka实战系列--Kafka的安装/配置

摘要：*) 安装和测试cd /path/to/server#) 下载kafka二进制包wget http://apache.fayea.com/apache-mirror/kafka/0.8.1.1/kafka_2.9.2-0.8.1.1.tgz#) 解压缩kafka包tar -zxvf kafka_2.... 阅读全文

posted @ 2014-07-22 10:22 mumuxinfei 阅读(1209) 评论(0) 推荐(0) 编辑

移动互联网实战--移动端音频和图形优化处理

摘要：前言: 移动端应用, 需要省电省流量(带宽), 大资源包对用户体验是有伤害的. 因此移动端开发需要精简资源(音频/图片), 但又要保证音频/图片质量. 本文着重讲述如何优化处理资源(音频/图片), 如何在高压缩比和高质量(音质/画质)之间进行折中和权衡. 本文涉及两大块, 一块为语音处理, 另一块... 阅读全文

posted @ 2014-07-21 16:42 mumuxinfei 阅读(2247) 评论(3) 推荐(5) 编辑

shell 脚本实战笔记(11)--Mysql在linux下的安装和简单运维

摘要：前言: linux中安装mysql以及配置的管理, 基础的运维和管理还是需要会一些的. 这边作下笔记, 以求天天向上(^_^).安装流程:*). 安装mysql-server1). 借助yum检索相关的mysql rpm包yum search mysqlmysql-server.x86_64 正... 阅读全文

posted @ 2014-07-19 13:06 mumuxinfei 阅读(656) 评论(0) 推荐(0) 编辑

Spark 个人实战系列(2)--Spark 服务脚本分析

摘要：前言: spark最近非常的火热, 本文不讲spark原理, 而是研究spark集群搭建和服务的脚本是如何编写的, 管中窥豹, 希望从运行脚本的角度去理解spark集群. 研究的spark为1.0.1版. spark集群采用standalone模式搭建, 其基础架构为master-slave(w... 阅读全文

posted @ 2014-07-17 16:20 mumuxinfei 阅读(1515) 评论(0) 推荐(0) 编辑

shell 脚本实战笔记(10)--spark集群脚本片段念念碎

摘要：前言: 通过对spark集群脚本的研读, 对一些重要的shell脚本技巧, 做下笔记. *). 取当前脚本的目录sbin=`dirname "$0"` sbin=`cd "$sbin"; pwd`代码评注:# 以上代码为获取执行脚本所在的目录的常用技巧# sbin=$(dirname $0) ... 阅读全文

posted @ 2014-07-17 12:40 mumuxinfei 阅读(743) 评论(0) 推荐(0) 编辑

Spark 个人实战系列(1)--Spark 集群安装

摘要：前言: CDH4不带yarn和spark, 因此需要自己搭建spark集群. 这边简单描述spark集群的安装过程, 并讲述spark的standalone模式, 以及对相关的脚本进行简单的分析.spark官网: http://spark.apache.org/downloads.html*)安装... 阅读全文

posted @ 2014-07-16 14:46 mumuxinfei 阅读(732) 评论(0) 推荐(0) 编辑

HBase 实战(1)--HBase的数据导入方式

摘要：前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇博文重点讲解HBase的数据导入, 描述三种方式, Client API, Bulkload, 以及Hive Over ... 阅读全文

posted @ 2014-07-14 13:02 mumuxinfei 阅读(9515) 评论(3) 推荐(4) 编辑

shell 脚本实战笔记(9)--linux自动批量添加用户

摘要：前言: 添加linux用户帐号,这个相对简单, 在面对集群, 许多机器的时候, 我们该如何去做和实现? 这篇短文, 简单讲解一些思路, 尽可能地涉及周边的一些知识点. 不光是运维人员会面临这个问题, 对一个基于linux平台的集群服务或软件(比如hadoop集群), 有时也会涉及到这块.应用场景:... 阅读全文

posted @ 2014-07-10 15:02 mumuxinfei 阅读(2408) 评论(0) 推荐(4) 编辑

shell 脚本实战笔记(8)--ssh免密码输入执行命令

摘要：前言: ssh命令, 没有指定密码的参数. 以至于在脚本中使用ssh命令的时候, 必须手动输入密码, 才能继续执行. 这样使得脚本的自动化执行变得很差, 尤其当ssh对应的机器数很多的时候, 会令人抓狂.本文讲解了两种方式, 一种借助expect脚本, 一种借助sshpass来实现.*) 借助e... 阅读全文

posted @ 2014-07-09 17:53 mumuxinfei 阅读(11313) 评论(5) 推荐(4) 编辑

Flume 实战(2)--Flume-ng-sdk源码分析

摘要：具体参考: 官方用户手册和开发指南http://flume.apache.org/FlumeDeveloperGuide.html*) 定位和简单例子1). Flume-ng-sdk是用于编写往flume agent发送数据的client sdk2). 简单示例RpcClient client = ... 阅读全文

posted @ 2014-07-09 11:36 mumuxinfei 阅读(1896) 评论(0) 推荐(2) 编辑

shell 脚本实战笔记(7)--集群网络相关知识和环境搭建

摘要：前言: 对网络相关的知识, 做下笔记. 包括IP地址A/B/C的分类, 静态地址的配置/DNS配置, 以及网卡相关信息查看.*) A/B/C/D类网络地址的划分IP地址=网络地址＋主机地址或 IP地址=主机地址＋子网地址＋主机地址IPv4的地址划分, 可以分为5种类型, A/B/C/D/E类A... 阅读全文

posted @ 2014-07-08 15:41 mumuxinfei 阅读(460) 评论(0) 推荐(0) 编辑

Flume 实战(1) -- 初体验

摘要：前言: Flume-ng是数据收集/聚合/传输的组件, Flume-ng抛弃了Flume OG原本繁重的zookeeper和Master, Collector, 其整体的架构更加的简洁和明了. 其基础组件就Agent进程, 内部又可以细分为Source, Channel, Sink三个组件, S... 阅读全文

posted @ 2014-07-03 15:34 mumuxinfei 阅读(3013) 评论(0) 推荐(3) 编辑

Hive 实战(2)--hive分区分桶实战

摘要：前言: 互联网应用, 当Mysql单机遇到性能瓶颈时, 往往采用的优化策略是分库分表. 由于互联网应用普遍的弱事务性, 这种优化效果非常的显著.而Hive作为数据仓库, 当数据量达到一定数量时, 查询性能会有所下降, 那如何利用数据的特点进行优化? 分区分桶作为Hive的优化的一个有力武器.*)... 阅读全文

posted @ 2014-07-03 11:22 mumuxinfei 阅读(16442) 评论(0) 推荐(2) 编辑

Hive 实战(1)--hive数据导入/导出基础

摘要：前沿: Hive也采用类SQL的语法, 但其作为数据仓库, 与面向OLTP的传统关系型数据库(Mysql/Oracle)有着天然的差别. 它用于离线的数据计算分析, 而不追求高并发/低延时的应用场景. 最显著的特别是, Hive的数据是Schema On Read, 对数据的写入非常的自由和松散,... 阅读全文

posted @ 2014-07-02 16:14 mumuxinfei 阅读(1226) 评论(0) 推荐(1) 编辑

mumuxinfei

07 2014 档案

Thrift 个人实战--Thrift RPC服务框架日志的优化

Thrift 个人实战--Thrift 服务化 Client的改造

Thrift 个人实战--Thrift 的序列化机制

Thrift 个人实战--Thrift 网络服务模型

Thrift 个人实战--初次体验Thrift

HBase 实战(2)--时间序列检索和面检索的应用场景实战

Kafka实战系列--Kafka API使用体验

Kafka实战系列--Kafka的安装/配置

移动互联网实战--移动端音频和图形优化处理

shell 脚本实战笔记(11)--Mysql在linux下的安装和简单运维

Spark 个人实战系列(2)--Spark 服务脚本分析

shell 脚本实战笔记(10)--spark集群脚本片段念念碎

Spark 个人实战系列(1)--Spark 集群安装

HBase 实战(1)--HBase的数据导入方式

shell 脚本实战笔记(9)--linux自动批量添加用户

shell 脚本实战笔记(8)--ssh免密码输入执行命令

Flume 实战(2)--Flume-ng-sdk源码分析

shell 脚本实战笔记(7)--集群网络相关知识和环境搭建

Flume 实战(1) -- 初体验

Hive 实战(2)--hive分区分桶实战

Hive 实战(1)--hive数据导入/导出基础

公告

导航

统计

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论