之于

Java String的高效统计子串出现次数

结论: 使用 substring 时, 尽量采用双脚标方式,

理由: substring 指定双脚标时, 比默认指定但脚标时会少复制一些字符

性能验证:

复制代码
import org.apache.commons.io.FileUtils;

import java.io.File;
import java.io.IOException;
import java.time.Duration;
import java.time.LocalTime;

public class TestProcessing {
    public static void main(String[] args) throws IOException {

        //功能测试小文件
        //String oldfile = "I:\\StudyProject\\5sProject\\filesearch\\test-source\\test.txt";

        //性能测试大文件
        String oldfile = "I:\\StudyProject\\5sProject\\filesearch\\test-source\\深入理解JVM-学习笔记.txt";
        String[] keys = {"加载", "接口", "使用", "初始化", "文件"};
        String content = FileUtils.readFileToString(new File(oldfile), "utf-8");
        int count = 0;
        LocalTime start = LocalTime.now();
        for (String key : keys) {
            for (int i = 0, length = content.length(), keyLength = key.length(); i + keyLength <= length; i++) {
                if (content.substring(i, i + keyLength).equals(key)) {
                    count++;
                }
            }
        }
        Duration between = Duration.between(start, LocalTime.now());
        System.out.println("count1: " + count + "  between1: " + between);

        int sum = 0;
        LocalTime start2 = LocalTime.now();
        for (String key : keys) {
            String temp = content;
            while (temp.contains(key)) {
                temp = temp.substring(temp.indexOf(key) + key.length());
                sum++;
            }
        }
        Duration between2 = Duration.between(start2, LocalTime.now());
        System.out.println("count2: " + sum + "  between2: " + between2);


    }

}
复制代码

 测试结果:

count1: 262890  between1: PT0.663S
count2: 262890  between2: PT4M55.925S

 

posted on   之于  阅读(636)  评论(0编辑  收藏  举报

编辑推荐:
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示