57、策略模式（下）

1、问题与解决思路

假设有这样一个需求，希望写一个小程序，实现对一个文件进行排序的功能
文件中只包含整型数，并且相邻的数字通过逗号来区隔
如果由你来编写这样一个小程序，你会如何来实现呢

你可能会说，这不是很简单嘛
只需要将文件中的内容读取出来，并且通过逗号分割成一个一个的数字，放到内存数组中
然后编写某种排序算法（比如快排），或者直接使用编程语言提供的排序函数，对数组进行排序，最后再将数组中的数据写入文件就可以了

但是如果文件很大呢，比如有 10GB 大小，因为内存有限（比如只有 8GB 大小），我们没办法一次性加载文件中的所有数据到内存中
这个时候，我们就要利用外部排序算法（具体怎么做，可以参看我的另一个专栏《数据结构与算法之美》中的 "排序" 相关章节）了
如果文件更大，比如有 100GB 大小
我们为了利用 CPU 多核的优势，可以在外部排序的基础之上进行优化，加入多线程并发排序的功能，这就有点类似 "单机版" 的 MapReduce
如果文件非常大，比如有 1TB 大小，即便是单机多线程排序，这也算很慢了
这个时候，我们可以使用真正的 MapReduce 框架，利用多机的处理能力，提高排序的效率

2、代码实现与分析

我先用最简单直接的方式实现将它实现出来

 public class Sorter {
 
    private static final long GB = 1024 * 1024 * 1024;
 
    public void sortFile(String filePath) {
        // 省略校验逻辑
        File file = new File(filePath);
        long fileSize = file.length();
 
        if (fileSize < 6 * GB) {          // [0, 6GB)
            quickSort(filePath);
        } else if (fileSize < 10 * GB) {  // [6GB, 10GB)
            externalSort(filePath);
        } else if (fileSize < 100 * GB) { // [10GB, 100GB)
            concurrentExternalSort(filePath);
        } else {                          // [100GB, ~)
            mapreduceSort(filePath);
        }
    }
 
    private void quickSort(String filePath) {
        // 快速排序
    }
 
    private void externalSort(String filePath) {
        // 外部排序
    }
 
    private void concurrentExternalSort(String filePath) {
        // 多线程外部排序
    }
 
    private void mapreduceSort(String filePath) {
        // 利用 MapReduce 多机排序
    }
}

 public class SortingTool {
    public static void main(String[] args) {
        Sorter sorter = new Sorter();
        sorter.sortFile(args[0]);
    }
}

在 "编码规范" 那一部分我们讲过，函数的行数不能过多，最好不要超过一屏的大小
所以为了避免 sortFile() 函数过长，我们把每种排序算法从 sortFile() 函数中抽离出来，拆分成 4 个独立的排序函数

如果只是开发一个简单的工具，那上面的代码实现就足够了，毕竟代码不多，后续修改、扩展的需求也不多，怎么写都不会导致代码不可维护
但如果我们是在开发一个大型项目，排序文件只是其中的一个功能模块，那我们就要在代码设计、代码质量上下点儿功夫了
只有每个小的功能模块都写好，整个项目的代码才能不差

在刚刚的代码中，我们并没有给出每种排序算法的代码实现
如果自己实现一下的话，你会发现每种排序算法的实现逻辑都比较复杂，代码行数都比较多，所有排序算法的代码实现都堆在 Sorter 一个类中，这就会导致这个类的代码很多
而在 "编码规范" 那一部分中讲到，一个类的代码太多也会影响到可读性、可维护性，除此之外，所有的排序算法都设计成 Sorter 的私有函数，也会影响代码的可复用性

3、代码优化与重构

只要掌握了我们之前讲过的设计原则和思想，针对上面的问题，即便我们想不到该用什么设计模式来重构，也应该能知道该如何解决

3.1、重构 1

那就是将 Sorter 类中的某些代码拆分出来，独立成职责更加单一的小类
实际上，拆分是应对类或者函数代码过多、应对代码复杂性的一个常用手段，按照这个解决思路，我们对代码进行重构

 public interface ISortAlg {
    void sort(String filePath);
}
 
// 快速排序
public class QuickSort implements ISortAlg {
    @Override
    public void sort(String filePath) {
    }
}
 
// 外部排序
public class ExternalSort implements ISortAlg {
    @Override
    public void sort(String filePath) {
    }
}
 
// 多线程外部排序
public class ConcurrentExternalSort implements ISortAlg {
    @Override
    public void sort(String filePath) {
    }
}
 
// 利用 MapReduce 多机排序
public class MapReduceSort implements ISortAlg {
    @Override
    public void sort(String filePath) {
    }
}

 public class Sorter {
 
    private static final long GB = 1024 * 1024 * 1024;
 
    public void sortFile(String filePath) {
        // 省略校验逻辑
        File file = new File(filePath);
        long fileSize = file.length();
 
        ISortAlg sortAlg;
        if (fileSize < 6 * GB) {          // [0, 6GB)
            sortAlg = new QuickSort();
        } else if (fileSize < 10 * GB) {  // [6GB, 10GB)
            sortAlg = new ExternalSort();
        } else if (fileSize < 100 * GB) { // [10GB, 100GB)
            sortAlg = new ConcurrentExternalSort();
        } else {                          // [100GB, ~)
            sortAlg = new MapReduceSort();
        }
 
        sortAlg.sort(filePath);
    }
}

经过拆分之后，每个类的代码都不会太多，每个类的逻辑都不会太复杂，代码的可读性、可维护性提高了
除此之外，我们将排序算法设计成独立的类，跟具体的业务逻辑（代码中的 if-else 那部分逻辑）解耦，也让排序算法能够复用
这一步实际上就是策略模式的第一步，也就是将策略的定义分离出来

3.2、重构 2

实际上，上面的代码还可以继续优化
每种排序类都是无状态的，我们没必要在每次使用的时候，都重新创建一个新的对象，所以我们可以使用工厂模式对对象的创建进行封装

 /**
 * 排序策略工厂
 */
public class SortAlgFactory {
 
    private static final Map<String, ISortAlg> algs = new HashMap<>();
 
    static {
        algs.put("QuickSort", new QuickSort());
        algs.put("ExternalSort", new ExternalSort());
        algs.put("ConcurrentExternalSort", new ConcurrentExternalSort());
        algs.put("MapReduceSort", new MapReduceSort());
    }
 
    public static ISortAlg getSortAlg(String type) {
        if (type == null || type.isEmpty()) {
            throw new IllegalArgumentException("type should not be empty.");
        }
        return algs.get(type);
    }
}

 public class Sorter {
 
    private static final long GB = 1024 * 1024 * 1024;
 
    public void sortFile(String filePath) {
        // 省略校验逻辑
        File file = new File(filePath);
        long fileSize = file.length();
 
        ISortAlg sortAlg;
        if (fileSize < 6 * GB) {          // [0, 6GB)
            sortAlg = SortAlgFactory.getSortAlg("QuickSort");
        } else if (fileSize < 10 * GB) {  // [6GB, 10GB)
            sortAlg = SortAlgFactory.getSortAlg("ExternalSort");
        } else if (fileSize < 100 * GB) { // [10GB, 100GB)
            sortAlg = SortAlgFactory.getSortAlg("ConcurrentExternalSort");
        } else {                          // [100GB, ~)
            sortAlg = SortAlgFactory.getSortAlg("MapReduceSort");
        }
        sortAlg.sort(filePath);
    }
}

3.3、重构 3

经过上面两次重构之后，现在的代码实际上已经符合策略模式的代码结构了，我们通过策略模式将策略的定义、创建、使用解耦，让每一部分都不至于太复杂

不过 Sorter 类中的 sortFile() 函数还是有一堆 if-else 逻辑，这里的 if-else 逻辑分支不多、也不复杂，这样写完全没问题
但如果你特别想将 if-else 分支判断移除掉，那也是有办法的，我直接给出代码，你一看就能明白
实际上这也是基于查表法来解决的，其中的 "algs" 就是 "表"

 /**
 * 使用策略模式，并且去掉 if - else
 */
public class Sorter {
 
    private static final long GB = 1024 * 1024 * 1024;
    private static final List<AlgRange> algs = new ArrayList<>();
 
    static {
        algs.add(new AlgRange(0, 6 * GB, SortAlgFactory.getSortAlg("QuickSort")));
        algs.add(new AlgRange(6 * GB, 10 * GB, SortAlgFactory.getSortAlg("ExternalSort")));
        algs.add(new AlgRange(10 * GB, 100 * GB, SortAlgFactory.getSortAlg("ConcurrentExternalSort")));
        algs.add(new AlgRange(100 * GB, Long.MAX_VALUE, SortAlgFactory.getSortAlg("MapReduceSort")));
    }
 
    public void sortFile(String filePath) {
        // 省略校验逻辑
        File file = new File(filePath);
        long fileSize = file.length();
 
        ISortAlg sortAlg = null;
        for (AlgRange algRange : algs) {
            if (algRange.inRange(fileSize)) {
                sortAlg = algRange.getAlg();
                break;
            }
        }
        sortAlg.sort(filePath);
    }
 
    private static class AlgRange {
 
        private long start;
        private long end;
        private ISortAlg alg;
 
        public AlgRange(long start, long end, ISortAlg alg) {
            this.start = start;
            this.end = end;
            this.alg = alg;
        }
 
        public ISortAlg getAlg() {
            return alg;
        }
 
        public boolean inRange(long size) {
            return size >= start && size < end;
        }
    }
}

现在的代码实现就更加优美了，我们把可变的部分隔离到了策略工厂类和 Sorter 类中的静态代码段中
当要添加一个新的排序算法时，我们只需要修改策略工厂类和 Sort 类中的静态代码段，其他代码都不需要修改，这样就将代码改动最小化、集中化了

3.4、更多优化

你可能会说，即便这样，当我们添加新的排序算法的时候，还是需要修改代码，并不完全符合开闭原则，有什么办法让我们完全满足开闭原则呢
对于 Java 语言来说，我们可以通过反射来避免对策略工厂类的修改，具体是这么做的

我们通过一个配置文件或者自定义的 annotation 来标注都有哪些策略类
策略工厂类读取配置文件或者搜索被 annotation 标注的策略类，然后通过反射了动态地加载这些策略类、创建策略对象
当我们新添加一个策略的时候，只需要将这个新添加的策略类添加到配置文件或者用 annotation 标注即可
对于 Sorter 来说，我们可以通过同样的方法来避免修改
我们通过将文件大小区间和算法之间的对应关系放到配置文件中
当添加新的排序算法时，我们只需要改动配置文件即可，不需要改动代码

上一篇Java API 总结

下一篇操作系统总结

posted @ 2023-07-03 14:31 lidongdongdong~ 阅读(9) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

lidong

57、策略模式（下）

1、问题与解决思路

2、代码实现与分析

3、代码优化与重构

3.1、重构 1

3.2、重构 2

3.3、重构 3

3.4、更多优化

公告

常用链接

随笔分类

随笔档案

阅读排行榜

推荐排行榜

	public class Sorter {

	private static final long GB = 1024 * 1024 * 1024;

	public void sortFile(String filePath) {
	// 省略校验逻辑
	File file = new File(filePath);
	long fileSize = file.length();

	if (fileSize < 6 * GB) { // [0, 6GB)
	quickSort(filePath);
	} else if (fileSize < 10 * GB) { // [6GB, 10GB)
	externalSort(filePath);
	} else if (fileSize < 100 * GB) { // [10GB, 100GB)
	concurrentExternalSort(filePath);
	} else { // [100GB, ~)
	mapreduceSort(filePath);
	}
	}

	private void quickSort(String filePath) {
	// 快速排序
	}

	private void externalSort(String filePath) {
	// 外部排序
	}

	private void concurrentExternalSort(String filePath) {
	// 多线程外部排序
	}

	private void mapreduceSort(String filePath) {
	// 利用 MapReduce 多机排序
	}
	}

	public class SortingTool {
	public static void main(String[] args) {
	Sorter sorter = new Sorter();
	sorter.sortFile(args[0]);
	}
	}

	public interface ISortAlg {
	void sort(String filePath);
	}

	// 快速排序
	public class QuickSort implements ISortAlg {
	@Override
	public void sort(String filePath) {
	}
	}

	// 外部排序
	public class ExternalSort implements ISortAlg {
	@Override
	public void sort(String filePath) {
	}
	}

	// 多线程外部排序
	public class ConcurrentExternalSort implements ISortAlg {
	@Override
	public void sort(String filePath) {
	}
	}

	// 利用 MapReduce 多机排序
	public class MapReduceSort implements ISortAlg {
	@Override
	public void sort(String filePath) {
	}
	}

	/**
	* 排序策略工厂
	*/
	public class SortAlgFactory {

	private static final Map<String, ISortAlg> algs = new HashMap<>();

	static {
	algs.put("QuickSort", new QuickSort());
	algs.put("ExternalSort", new ExternalSort());
	algs.put("ConcurrentExternalSort", new ConcurrentExternalSort());
	algs.put("MapReduceSort", new MapReduceSort());
	}

	public static ISortAlg getSortAlg(String type) {
	if (type == null \|\| type.isEmpty()) {
	throw new IllegalArgumentException("type should not be empty.");
	}
	return algs.get(type);
	}
	}

	/**
	* 使用策略模式，并且去掉 if - else
	*/
	public class Sorter {

	private static final long GB = 1024 * 1024 * 1024;
	private static final List<AlgRange> algs = new ArrayList<>();

	static {
	algs.add(new AlgRange(0, 6 * GB, SortAlgFactory.getSortAlg("QuickSort")));
	algs.add(new AlgRange(6 * GB, 10 * GB, SortAlgFactory.getSortAlg("ExternalSort")));
	algs.add(new AlgRange(10 * GB, 100 * GB, SortAlgFactory.getSortAlg("ConcurrentExternalSort")));
	algs.add(new AlgRange(100 * GB, Long.MAX_VALUE, SortAlgFactory.getSortAlg("MapReduceSort")));
	}

	public void sortFile(String filePath) {
	// 省略校验逻辑
	File file = new File(filePath);
	long fileSize = file.length();

	ISortAlg sortAlg = null;
	for (AlgRange algRange : algs) {
	if (algRange.inRange(fileSize)) {
	sortAlg = algRange.getAlg();
	break;
	}
	}
	sortAlg.sort(filePath);
	}

	private static class AlgRange {

	private long start;
	private long end;
	private ISortAlg alg;

	public AlgRange(long start, long end, ISortAlg alg) {
	this.start = start;
	this.end = end;
	this.alg = alg;
	}

	public ISortAlg getAlg() {
	return alg;
	}

	public boolean inRange(long size) {
	return size >= start && size < end;
	}
	}
	}