FastDFS --- 分布式文件系统
目录
FastDFS
什么是分布式文件系统
- 分布式文件系统解决了海量文件存储及传输访问的瓶颈问题,对海量视频的管理、对海量图片的管理等。
- 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。
为什么会有分布文件系统
存在问题
- 分布式文件系统是面对互联网的需求而产生,互联网时代对海量数据如何存储?
- 靠简单的增加硬盘的个数已经满足 不了我们的要求,因为硬盘传输速度有限但是数据在急剧增长,
- 另外我们还要要做好数据备份、数据安全等。
解决办法
- 采用分布式文件系统可以将多个地点的文件系统通过网络连接起来
- 组成一个文件系统网络,结点之间通过网络进行通信
- 一台文件系统的存储和传输能力有限,我们让文件在多台计算机上存储,通过多台计算共同传输
示例图
好处
- 一台计算机的文件系统处理能力扩充到多台计算机同时处理
- 一台计算机挂了,还有另外的副本计算机提供数据。
- 每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度
主流的分布式文件系统
NFS(Network File System),即网络文件系统
- 在客户端上映射NFS服务器的驱动器
- 客户端通过网络访问NFS服务器的硬盘完全透明。
结构图
GFS(Google File System)
- GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成
- master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。
- 用户从master中获取数据元信息,从chunkserver存储数据
结构图
HDFS(Hadoop Distributed File System)
- Hadoop分布式文件系统主要用于大数据
- HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成
- 名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。
- 客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从数据块来存取数据。
结构图
什么是fastDFS
简介
FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。
FastDFS专为互联 网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标
使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务
为什么要使用fastDFS
通用分布式文件系统
- NFS、GFS都是通用的分布式文件系统
- 通用的分布式文件系统的优点的是开发体验好,但是系统复杂 性高、性能一般
专用分布式文件系统
- 专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。
- fastDFS非常适合存储图片等那些小文件,fastDFS不对文件进行分块,所以它就没有分块合并的开销,fastDFS网络通信采用 socket,通信速度很快
fastDFS工作原理
- FastDFS架构包括 Tracker server和Storage server。
- 客户端请求Tracker server进行文件上传、下载,通过Tracker server调度最终由Storage server完成文件上传和下载。
结构图
Tracker
作用
Tracker Server作用是负载均衡和调度,
通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。
可以将tracker称为追踪服务器或调度服务器。
集群
FastDFS集群中的Tracker server可以有多台
Tracker server之间是相互平等关系同时提供服务.
客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。
Storage
作用
Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上
集群
Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容量之和
一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,
不同组的Storage server之间不会相互通信
同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件是完全一致的
一个组的存储容量为该组内的存储服务器容量最小的那个
采用分组存储方式的好处
灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择。
一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向 扩容)
当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
Storage状态收集
Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,
包括磁盘剩余空间、文件同步 状况、文件上传下载次数等统计信息。
FastDFS安装与配置
- FastDFS是 C 语言开发,建议在 linux 上运行
- 安装 FastDFS需要先将官网下载的源码进行编译,编译依赖 gcc 环境,如果没有 gcc 环境,需要先安装gcc
1.需要安装 gcc
yum install gcc-c++
2.安装libevent(FastDFS依赖libevent库)
yum -y install libevent
3.安装libfastcommon (由 FastDFS 官方提供,包含了 FastDFS 运行所需要的一些基础库)
将libfastcommonV1.0.7.tar.gz拷贝至/usr/local/下
cd /usr/local/
tar -zxvf libfastcommonV1.0.7.tar.gz
cd libfastcommon-1.0.7
./make.sh
./make.sh install
libfastcommon安装好后会自动将库文件拷贝至/usr/lib64下
4.安装libevent
cd /usr/local/
tar -zxvf libevent-2.0.15-stable.tar.gz
cd libevent-2.0.15-stable/
./configure
make && make install
ln -s /usr/local/lib/libevent-2.0.so.5 /usr/lib/libevent-2.0.so.5
5.tracker编译安装
将FastDFS_v5.05.tar.gz拷贝至/usr/local/下
tar -zxvf FastDFS_v5.05.tar.gz
cd FastDFS
./make.sh
./make.sh install
安装成功将安装目录下的conf下的文件拷贝到/etc/fdfs/下
cp -ri conf/* /etc/fdfs
进入/etc/fdfs目录
cd /etc/fdfs
修改tracker.conf
vim tracker.conf
base_path=/home/fastdfs
http.server_port=80
创建目录
mkdir -p /home/fastdfs
启动
/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart
6.进入/etc/fdfs
cd /etc/fdfs
vi storage.conf
group_name=group1
base_path=/home/yuqing/FastDFS改为:base_path=/home/fastdfs
store_path0=/home/fastdfs/fdfs_storage
#配置tracker服务器:IP如果有多个则配置多个tracker
tracker_server=192.168.1.88:22122
http.server_port=80
mkdir -p /home/fastdfs/fdfs_storage
/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart
查看是否启动
ps aux|grep dfs
文件上传流程
流程图
文件信息
客户端上传文件后,存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。
文件索引信息 包括:组名,虚拟磁盘路径,数据两级目录,文件名
组名:
文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
虚拟磁盘路径:
storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00, 如果配置了store_path1则是M01,以此类推。
数据两级目录:
storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件
文件名:
是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创 建时间戳、文件大小、随机数和文件拓展名等信息
通过客户端上传图片
添加fastdfs依赖
<dependencies>
<dependency>
<groupId>org.csource.fastdfs</groupId>
<artifactId>fastdfs</artifactId>
<version>1.2</version>
</dependency>
</dependencies>
在resources当中创建fdfs_client.conf配置文件
# connect timeout in seconds
# default value is 30s
connect_timeout=30
# network timeout in seconds
# default value is 30s
network_timeout=60
# the base path to store log files
base_path=/home/fastdfs
# tracker_server can ocur more than once, and tracker_server format is
# "host:port", host can be hostname or ip address
tracker_server=192.168.1.88:22122
#standard log level as syslog, case insensitive, value list:
### emerg for emergency
### alert
### crit for critical
### error
### warn for warning
### notice
### info
### debug
log_level=info
# if use connection pool
# default value is false
# since V4.05
use_connection_pool = false
# connections whose the idle time exceeds this time will be closed
# unit: second
# default value is 3600
# since V4.05
connection_pool_max_idle_time = 3600
# if load FastDFS parameters from tracker server
# since V4.05
# default value is false
load_fdfs_parameters_from_tracker=false
# if use storage ID instead of IP address
# same as tracker.conf
# valid only when load_fdfs_parameters_from_tracker is false
# default value is false
# since V4.05
use_storage_id = false
# specify storage ids filename, can use relative or absolute path
# same as tracker.conf
# valid only when load_fdfs_parameters_from_tracker is false
# since V4.05
storage_ids_filename = storage_ids.conf
#HTTP settings
http.tracker_server_port=80
#use "#include" directive to include HTTP other settiongs
##include http.conf
创建测试,上传图片
public static void main(String[] args) throws Exception {
//1. 加载配置文件
ClientGlobal.init("D:\\Java\\testcode\\fastDFSProject\\src\\main\\resources\\fdfs_client.conf");
//2. 创建管理端对象
TrackerClient trackerClient = new TrackerClient();
//3. 通过管理端对象获取连接
TrackerServer connection = trackerClient.getConnection();
//4. 创建存储端对象
StorageClient1 storageClient = new StorageClient1(connection, null);
//创建文件属性信息对象数组
NameValuePair[] meta_list = new NameValuePair[3];
meta_list[0] = new NameValuePair("fileName","idea");
meta_list[1] = new NameValuePair("ExtName","jpg");
meta_list[2] = new NameValuePair("zuozhe","gaowei");
//5. 上传文件
String path = storageClient.upload_file1("E:\\idea.jpg", "jpg", meta_list);
System.out.println("======" + path);
}
搭建图片服务虚拟主机
在Storage上安装nginx
- 在storage server上安装nginx的目的是对外通过http访问storage server 上的文件
- 使用 nginx 的模块 FastDFS-nginx-module 的作用是通过 http 方式访问 storage 中的文件
安装FastDFS-nginx-module_v1.16
将 FastDFS-nginx-module_v1.16.tar.gz上到usr/local下
cd /usr/local
tar -zxvf fastdfs-nginx-module_v1.16.tar.gz
rm -rf fastdfs-nginx-module_v1.16.tar.gz
cd fastdfs-nginx-module/src
修改config文件将带有/usr/local/的路径改为/usr/
vi config
esc后保存并退出 :wq
将FastDFS-nginx-module/src下的mod_FastDFS.conf拷贝至/etc/fdfs/下
cp mod_fastdfs.conf /etc/fdfs/
修改mod_fastdfs.conf
vim /etc/fdfs/mod_fastdfs.conf
base_path=/home/fastdfs
tracker_server=192.168.1.88:22122
url_have_group_name=true
store_path0=/home/fastdfs/fdfs_storage
esc后保存并退出 :wq
将libfdfsclient.so拷贝至/usr/lib下
cp /usr/lib64/libfdfsclient.so /usr/lib/
复制 FastDFS的部分配置文件到/etc/fdfs目录,根据相对应的安装情况进入到相对应的路径
cd /usr/local/FastDFS/conf/
cp http.conf mime.types /etc/fdfs/
nginx安装
将nginx-1.8.1.tar.gz拷贝到/usr/local下
cd /usr/local
解压nginx-1.8.1.tar.gz
tar -zxvf nginx-1.8.1.tar.gz
rm -rf nginx-1.8.1.tar.gz
安装依赖包
sudo yum -y install pcre pcre-devel zlib zlib-devel openssl openssl-devel
cd nginx-1.8.1/
执行配置
./configure --prefix=/opt/nginx --sbin-path=/usr/bin/nginx --add-module=/usr/local/fastdfs-nginx-module/src
make
make install
useradd -s /sbin/nologin -M nginx
id nginx
启动
nginx
停止
nginx -s stop
重新加载配置
nginx -s reload
查看是否启动
ps -ef|grep nginx
修改配置文件,添加上
vim /opt/nginx/conf/nginx.conf
#监听域名中带有group的,交给FastDFS模块处理
location ~/group([0-9])/ {
ngx_fastdfs_module;
}
启动
/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart
/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart
nginx
富文本编辑器umedit上传图片到FastDFS
修改配置文件plugins/umedit/jsp/config.json接口地址
"imageActionName": "upload/uploadImage.do", /* 执行上传图片的action名称 */
"imageFieldName": "upfile", /* 提交的图片表单名称 */
"imageMaxSize": 2048000, /* 上传大小限制,单位B */
"imageAllowFiles": [".png", ".jpg", ".jpeg", ".gif", ".bmp"], /* 上传图片格式显示 */
"imageCompressEnable": true, /* 是否压缩图片,默认是true */
"imageCompressBorder": 1600, /* 图片压缩最长边限制 */
"imageInsertAlign": "none", /* 插入的图片浮动方式 */
"imageUrlPrefix": "", /* 图片访问路径前缀 */
"imagePathFormat": "", /* 上传保存路径,可以自定义保存路径和文件名格式 */
实例化时, 修改文件上传请求地址
ue.ready(function() {
UE.Editor.prototype._bkGetActionUrl = UE.Editor.prototype.getActionUrl;
UE.Editor.prototype.getActionUrl = function (action) {
if (action == 'upload/uploadImage.do') {
return "http://localhost:8082/upload/uploadImage.do";
} else {
return this._bkGetActionUrl.call(this, action);
}
};
});
定义上传图片接口
@RequestMapping("/uploadImage")
public Map uploadImage(MultipartFile upfile) throws Exception {
try {
FastDFSClient fastDFS = new FastDFSClient("classpath:fastDFS/fdfs_client.conf");
//上传文件返回文件保存的路径和文件名
String path = fastDFS.uploadFile(upfile.getBytes(), upfile.getOriginalFilename(), upfile.getSize());
//拼接上服务器的地址返回给前端
String url = FILE_SERVER + path;
Map<String ,Object > result = new HashMap<>();
result.put("state","SUCCESS");
result.put("url",url);
result.put("title",upfile.getOriginalFilename());
result.put("original",upfile.getOriginalFilename());
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
商品图片上传至fastFDS
引入pom文件
<dependency>
<groupId>org.csource.fastdfs</groupId>
<artifactId>fastdfs</artifactId>
<version>1.2</version>
</dependency>
引入fastDFS配置文件和服务地址配置文件
application.properties
FILE_SERVER_URL=http://192.168.1.88/
fdfs_client.conf
# connect timeout in seconds
# default value is 30s
connect_timeout=30
# network timeout in seconds
# default value is 30s
network_timeout=60
# the base path to store log files
base_path=/home/fastdfs
# tracker_server can ocur more than once, and tracker_server format is
# "host:port", host can be hostname or ip address
tracker_server=192.168.1.88:22122
#standard log level as syslog, case insensitive, value list:
### emerg for emergency
### alert
### crit for critical
### error
### warn for warning
### notice
### info
### debug
log_level=info
# if use connection pool
# default value is false
# since V4.05
use_connection_pool = false
# connections whose the idle time exceeds this time will be closed
# unit: second
# default value is 3600
# since V4.05
connection_pool_max_idle_time = 3600
# if load FastDFS parameters from tracker server
# since V4.05
# default value is false
load_fdfs_parameters_from_tracker=false
# if use storage ID instead of IP address
# same as tracker.conf
# valid only when load_fdfs_parameters_from_tracker is false
# default value is false
# since V4.05
use_storage_id = false
# specify storage ids filename, can use relative or absolute path
# same as tracker.conf
# valid only when load_fdfs_parameters_from_tracker is false
# since V4.05
storage_ids_filename = storage_ids.conf
#HTTP settings
http.tracker_server_port=80
#use "#include" directive to include HTTP other settiongs
##include http.conf
在spring-mvc.xml加载属性文件
<context:property-placeholder location="classpath:config/application.properties" />
在common中引入上传工具类 FastDFSClient
import org.apache.commons.io.FilenameUtils;
import org.csource.common.NameValuePair;
import org.csource.fastdfs.*;
import java.io.IOException;
public class FastDFSClient {
private TrackerClient trackerClient = null;
private TrackerServer trackerServer = null;
private StorageServer storageServer = null;
private StorageClient1 storageClient = null;
public FastDFSClient(String conf) throws Exception {
if (conf.contains("classpath:")) {
conf = conf.replace("classpath:", this.getClass().getResource("/").getPath());
}
ClientGlobal.init(conf);
trackerClient = new TrackerClient();
trackerServer = trackerClient.getConnection();
storageServer = null;
storageClient = new StorageClient1(trackerServer, storageServer);
}
/**
* @param file 文件二进制
* @param fileName 文件名
* @param fileSize 文件大小
* @return
* @throws Exception
*/
public String uploadFile(byte[] file, String fileName, long fileSize) throws Exception {
NameValuePair[] metas = new NameValuePair[3];
metas[0] = new NameValuePair("fileName", fileName);
metas[1] = new NameValuePair("fileSize", String.valueOf(fileSize));
metas[2] = new NameValuePair("fileExt", FilenameUtils.getExtension(fileName));
String result = storageClient.upload_file1(file, FilenameUtils.getExtension(fileName), metas);
return result;
}
/**
*
* @param storagePath 文件的全部路径 如:group1/M00/00/00/wKgRsVjtwpSAXGwkAAAweEAzRjw471.jpg
* @return -1失败,0成功
* @throws Exception
*/
public Integer delete_file(String storagePath){
int result=-1;
try {
result = storageClient.delete_file1(storagePath);
} catch (Exception e) {
e.printStackTrace();
}
return result;
}
}
在UploadController方法中上传图片
@Value("${FILE_SERVER_URL}")
private String FILE_SERVER;
@RequestMapping("/uploadFile")
public Result uploadFile(MultipartFile file) throws Exception {
try {
FastDFSClient fastDFS = new FastDFSClient("classpath:fastDFS/fdfs_client.conf");
//上传文件返回文件保存的路径和文件名
String path = fastDFS.uploadFile(file.getBytes(), file.getOriginalFilename(), file.getSize());
//拼接上服务器的地址返回给前端
return new Result(true, FILE_SERVER + path);
} catch (Exception e) {
e.printStackTrace();
return new Result(false, "上传失败!");
}
}
SPU与SKU
SPU = Standard Product Unit (标准化产品单元)
SPU是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合
该集合描述了一个产品的特性
spu 属性,不会影响到库存和价格的属性, 又叫关键属性
举例
Oppo R17这是商品的SPU
但Oppo R17只是一个名词,单纯的理解这个名词是没有意义的
SPU是一组商品的属性组合
【硬件参数】:
CPU 型号:高通骁龙™ 670
CPU 频率:2.0GHz
核心数:八核
处理器位数:64 位
GPU 型号:Adreno™ 615
电池容量:3500mAh(典型值)*
【尺寸】:
长:约 157.5mm
宽:约 74.9mm
厚:约 7.5mm
重:约 182g
毛重: 420.00 g
产地: 中国大陆
这个SPU属性组合的名称叫做Oppo R17
SKU=stock keeping unit(库存量单位)
会影响到库存和价格的属性, 又叫销售属性
指的是具体规格单品
买家购买、商家进货、供应商备货、工厂生产都是依据SKU进行的
影响价格和库存的属性集合, 与商品是多对一的关系,即一个商品有多个SKU
举例
如流光蓝(三种颜色:流光蓝、霓光紫、霓光渐变色)+8G+128G(两种配置:8G+128G、6G+128G)。
即Oppo R17有一个SPU、6种SKU。
如一件M码(四个尺码:S码、M码、L码、X码)的粉色(三种颜色:粉色、黄色、黑色)Zara女士风衣,其中M码、粉色就是一组SKU的组合
SKU在生成时, 会根据属性生成相应的笛卡尔积,根据一组SKU可以确定商品的库存情况,那么上面的Zara女士风衣一共有4 * 3 = 12个SKU组合