随笔分类 -  分布式

摘要:什么是文件系统?首先回答最常见的问题,“什么是文件系统”。文件系统是对一个存储设备上的数据和元数据进行组织的机制。由于定义如此宽泛,支持它的代码会很有意思。正如前面提到的,有许多种文件系统和媒体。由于存在这么多类型,可以预料到 Linux 文件系统接口实现为分层的体系结构,从而将用户接口层、文件系统实现和操作存储设备的驱动程序分隔开。挂装在 Linux 中将一个文件系统与一个存储设备关联起来的过程称为挂装(mount)。使用 mount 命令将一个文件系统附着到当前文件系统层次结构中(根)。在执行挂装时,要提供文件系统类型、文件系统和一个挂装点。 为了说明 Linux 阅读全文
posted @ 2011-02-17 15:37 chinacloud 阅读(10574) 评论(1) 推荐(3) 编辑
摘要:简单看了一下这篇文章,对其中一些机制的实现还不是很明白,还需要研究,在此做个记号。Btrfs 简介文件系统似乎是内核中比较稳定的部分,多年来,人们一直使用 ext2/3,ext 文件系统以其卓越的稳定性成为了事实上的 Linux 标准文件系统。近年来 ext2/3 暴露出了一些扩展性问题,于是便催生了 ext4 。在 2008 年发布的 Linux2.6.19 内核中集成了 ext4 的 dev 版本。 2.6.28 内核发布时,ext4 结束了开发版,开始接受用户的使用。似乎 ext 就将成为 Linux 文件系统的代名词。然而当您阅读很多有关 ext4 的文章时,会发现都不约而同地提到了 阅读全文
posted @ 2011-02-16 11:40 chinacloud 阅读(15066) 评论(0) 推荐(0) 编辑
摘要:淘宝的TFS已经在其内部应用的比较成熟,但对大文件的存储支持的还不太好。2.0版本正在改进,非常期待。好好研究一下TFS、FastDFS和Ceph,相信会有很多收获的。简介 TFS(Taobao FileSystem)是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统,主要针对海量的非结构化数据,它构筑在普通的Linux机器集群上,可为外部提供高可靠和高并发的存储访问。TFS为淘宝提供海量小文件存储,通常文件大小不超过1M,满足了淘宝对小文件存储的需求,被广泛地应用在淘宝各项应用中。它采用了HA架构和平滑扩容,保证了整个文件系统的可用性和扩展性。同时扁平化的数据组织结构,可将文件名 阅读全文
posted @ 2011-02-15 14:37 chinacloud 阅读(2049) 评论(0) 推荐(0) 编辑
摘要:The communication protocol of FastDFS is TCP/IP, the package composes of header and body which may be empty.header format: @ TRACKER_PROTO_PKG_LEN_SIZE bytes package length @ 1 byte command @ 1 byte statusnote: #TRACKER_PROTO_PKG_LEN_SIZE (8) bytes number buff is Big-Endian bytesbody format:1. commo 阅读全文
posted @ 2011-01-19 13:43 chinacloud 阅读(998) 评论(0) 推荐(0) 编辑
摘要:在FastDFS的服务器端配置文件中,bind_addr这个参数用于需要绑定本机IP地址的场合。只有这个参数和主机特征相关,其余参数都是可以统一配置的。在不需要绑定本机的情况下,为了便于管理和维护,建议所有tracker server的配置文件相同,同组内的所有storage server的配置文件相同。tracker server的配置文件中没有出现storage server,而storage server的配置文件中会列举出所有的tracker server。这就决定了storage server和tracker server之间的连接由storage server主动发起,storag 阅读全文
posted @ 2011-01-19 13:42 chinacloud 阅读(2618) 评论(0) 推荐(0) 编辑
摘要:本文较详细地介绍了FastDFS服务器端的目录结构和文件格式,包括tracker server和storage server两部分。有兴趣对FastDFS进行深入了解和研究的朋友,可以阅读本篇文章。FastDFS服务器端运行时目录结构如下: ${base_path} |__data:存放数据文件 |__logs:存放日志文件其中,${base_path}由配置文件中的参数“base_path”设定。一、tracker servertracker server目录及文件结构: ${base_path} |__data | |__storage_groups.dat:存储分组信息 | |__sto 阅读全文
posted @ 2011-01-19 13:40 chinacloud 阅读(3172) 评论(0) 推荐(1) 编辑
摘要:首先是 tracker.conf# is this config file disabled# false for enabled# true for disableddisabled=false# 这个配置文件是否不生效,呵呵(改成是否生效是不是会让人感觉好点呢?) false 为生效(否则不生效) true反之# bind an address of this host# empty for bind all addresses of this hostbind_addr=# 是否绑定IP,# bind_addr= 后面为绑定的IP地址 (常用于服务器有多个IP但只希望一个IP提供服务)。 阅读全文
posted @ 2011-01-19 10:44 chinacloud 阅读(3623) 评论(0) 推荐(1) 编辑
摘要:1.除了在storage.conf里的tracker_server增加tracker的ip和端口,其他地方要注意什么?恩,tracker server ip和端口,肯定是要正确设置的。支持多tracker server,每行设置一个tracker。另外,base_path也要正确设置。其余参数,通常采用缺省配置即可。你可以看一下配置说明那个帖子。每台tracker和storage的启动有没有先后关系?正常情况下,应该先启动tracker。FastDFS不会有这样的要求,你要启动storage也是没有任何问题的。2.想要把fastDFS产生的记录清空,再重新搭建一次,应该删除哪些文件 阅读全文
posted @ 2011-01-19 10:11 chinacloud 阅读(18084) 评论(0) 推荐(1) 编辑
摘要:文/余庆FastDFS是一款类GoogleFS的开源分布式文件系统,它用纯C语言实现,支持Linux、FreeBSD、AIX等UNIX系统。它只能通过专有API对文件进行存取访问,不支持POSIX接口方式,不能mount使用。准确地讲,GoogleFS以及FastDFS、mogileFS、HDFS、TFS等类GoogleFS都不是系统级的分布式文件系统,而是应用级的分布式文件存储服务。FastDFS的设计理念FastDFS是为互联网应用量身定做的分布式文件系统,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标。和现有的类GoogleFS分布式文件系统相比,FastDFS 阅读全文
posted @ 2011-01-14 11:43 chinacloud 阅读(976) 评论(0) 推荐(0) 编辑
摘要:取名 Paxos(Greek: Παξοί,pronouncedPaksi in English)又名Paxi是希腊西南部一个风景如画的小岛。而Paxos算法则是现在很火的分布式一致性算法,为何以一个希腊小岛名字算法?Lamport这样解释道:I thought, and still think, that Paxos is an important algorithm. Inspired by my success at popularizing the consensus problem by describing it with Byzantine generals, I decided 阅读全文
posted @ 2011-01-10 10:07 chinacloud 阅读(3886) 评论(0) 推荐(0) 编辑
摘要:作为一名存储行业的架构师,我对文件系统情有独钟。这些系统用来存储系统的用户界面,虽然它们倾向于提供一系列类似的功能,但它们还能够提供差异显著的功能。Ceph 也不例外,它还提供一些您能在文件系统中找到的最有趣的功能。Ceph 最初是一项关于存储系统的 PhD 研究项目,由 Sage Weil 在 University of California, Santa Cruz(UCSC)实施。但是到了 2010 年 3 月底,您可以在主线 Linux 内核(从 2.6.34 版开始)中找到 Ceph 的身影。虽然 Ceph 可能还不适用于生产环境,但它对测试目的还是非常有用的。本文探讨了 Ceph 文 阅读全文
posted @ 2010-11-16 13:21 chinacloud 阅读(1707) 评论(1) 推荐(0) 编辑