Data - 随笔分类 - losbyday

[Big Data]Spark

摘要：SPARK Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读阅读全文

posted @ 2016-09-10 17:36 losbyday 阅读(348) 评论(0) 推荐(0) 编辑

Big Data架构师技能图谱

摘要：大数据通用处理平台 Spark Flink Hadoop 分布式存储 HDFS 资源调度 Yarn Mesos 机器学习工具 Mahout Spark Mlib TensorFlow (Google 系) Amazon Machine Learning DMTK (微软分布式机器学习工具) 数据分析阅读全文

posted @ 2016-09-08 21:48 losbyday 阅读(887) 评论(0) 推荐(0) 编辑

[Big Data]从Hadoop到Spark的架构实践

摘要：摘要：本文则主要介绍TalkingData在大数据平台建设过程中，逐渐引入Spark，并且以Hadoop YARN和Spark为基础来构建移动大数据平台的过程。当下，Spark已经在国内得到了广泛的认可和支持：2014年，Spark Summit China在北京召开，场面火爆；同年，Spark 阅读全文

posted @ 2016-09-08 21:46 losbyday 阅读(1254) 评论(0) 推荐(0) 编辑

RAID详解[RAID0/RAID1/RAID10/RAID5]

摘要：一．RAID定义RAID(Redundant Array of Independent Disk 独立冗余磁盘阵列)技术是加州大学伯克利分校1987年提出，最初是为了组合小的廉价磁盘来代替大的昂贵磁盘，同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。RAID就是一种由多块阅读全文

posted @ 2016-09-08 19:05 losbyday 阅读(719) 评论(0) 推荐(0) 编辑

rsync+inotify实现数据的实时备份

摘要：一、rsync概述 1.1、rsync的优点与不足 rsync与传统的cp、tar备份方式相比，rsync具有安全性高、备份迅速、支持增量备份等优点，通过rsync可以解决对实时性要求不高的数据备份需求，例如定期的备份文件服务器数据到远端服务器，对本地磁盘定期做数据镜像等。随着应用系统规模的不断扩阅读全文

posted @ 2016-09-07 18:48 losbyday 阅读(3769) 评论(0) 推荐(0) 编辑

Memcached缓存系统介绍及安装

摘要：1、什么是Memcached 1.1、Memcached概述 Memcached是一个免费的开源的、高性能的、具有又分布式内存对象的缓存系统，它通过减轻数据库负载加速动态WEB应用， 1.2、Memcached和数据库交互流程 (1)、检查客户端请求的数据是在Memcached中存在，如果存在，直接阅读全文

posted @ 2016-09-07 00:21 losbyday 阅读(468) 评论(0) 推荐(0) 编辑

学习Redis从这里开始

摘要：本文主要内容 Redis与其他软件的相同之处和不同之处 Redis的用法使用Python示例代码与Redis进行简单的互动使用Redis解决实际问题 Redis是一个远程内存数据库，它不仅性能强劲，而且还具有复制特性以及为解决问题而生的独一无二的数据模型。Redis提供了5种不同类型的数据结构阅读全文

posted @ 2016-09-06 23:57 losbyday 阅读(4253) 评论(0) 推荐(0) 编辑

[Big Data]Hadoop详解一

摘要：从数据爆炸开始。。。一、第三次工业革命第一次：18世纪60年代，手工工厂向机器大生产过渡，以蒸汽机的发明和使用为标志。第二次：19世纪70年代，各种新技术新发明不断被应用于工业生产，以电力的发明使用为标志。第三次：20世界四五十年代末，以高新技术为代表的新科学技术革命，以原子能、航天技术和阅读全文

posted @ 2016-09-05 23:32 losbyday 阅读(1575) 评论(0) 推荐(0) 编辑

DRBD（数据镜像）+hearbeat（自动切换）

摘要：DRBD 数据镜像软件一、DRBD介绍 1.1、数据镜像软件DRBD介绍分布式块设备复制(Distributed Relicated Block Deivce,DRBD)，是一种基于软件、基于网络的块复制存储解决方案，主要用于对服务器之间的磁盘、分区、逻辑卷等进行数据镜像，当用户将数据写入本地磁阅读全文

posted @ 2016-08-29 21:12 losbyday 阅读(2096) 评论(0) 推荐(0) 编辑

数据恢复软件Extundelete

摘要：数据恢复软件Extundelete介绍一、概述作为一名运维人员，保证数据的安全是根本职责，所以在维护系统的时候，要慎重和细心，但是有时也难免发生出现数据被误删除的情况，这个时候该如何快速、有效地恢复数据呢？ 1.1、如何使用rm –rf命令在Linux系统下，通过 rm –rf 可以将如何数据阅读全文

posted @ 2016-08-29 21:07 losbyday 阅读(1126) 评论(0) 推荐(0) 编辑

支持持久化的内存数据库-----Redis

摘要：一、Redis概述 1.1、什么是Redis Redis是一种高级key-value数据库。它跟memcached类似，不过数据可以持久化，而且支持的数据类型很丰富。有字符串，链表，集合和有序集合。支持在服务器端计算集合的并，交和补集(difference)等，还支持多种排序功能。所以Redis 阅读全文

posted @ 2016-08-29 21:00 losbyday 阅读(11719) 评论(0) 推荐(0) 编辑

[Big Data]hadoop分布式系统在Linux系统安装

摘要：待完善 Hadoop2.6.0部署与应用一、环境准备硬件：3台虚拟机内存：至少512MB 硬盘：至少20G 操作系统：rhel6.4 64位最小化安装主机名 IP（局域网）描述 Master 192.168.111.5 hdfs主节点，yarn主节点 slaves1 192.168.1 阅读全文

posted @ 2016-08-27 23:15 losbyday 阅读(315) 评论(0) 推荐(0) 编辑

随笔分类 - Data

[Big Data]Spark

Big Data架构师技能图谱

[Big Data]从Hadoop到Spark的架构实践

RAID详解[RAID0/RAID1/RAID10/RAID5]

rsync+inotify实现数据的实时备份

Memcached缓存系统介绍及安装

学习Redis从这里开始

[Big Data]Hadoop详解一

DRBD（数据镜像）+hearbeat（自动切换）

数据恢复软件Extundelete

支持持久化的内存数据库-----Redis

[Big Data]hadoop分布式系统在Linux系统安装

导航

统计

公告

常用链接

随笔分类 (209)

文章分类 (62)

文章档案 (63)

前辈

阅读排行榜

评论排行榜