Java String的高效统计子串出现次数
结论: 使用 substring 时, 尽量采用双脚标方式,
理由: substring 指定双脚标时, 比默认指定但脚标时会少复制一些字符
性能验证:
import org.apache.commons.io.FileUtils; import java.io.File; import java.io.IOException; import java.time.Duration; import java.time.LocalTime; public class TestProcessing { public static void main(String[] args) throws IOException { //功能测试小文件 //String oldfile = "I:\\StudyProject\\5sProject\\filesearch\\test-source\\test.txt"; //性能测试大文件 String oldfile = "I:\\StudyProject\\5sProject\\filesearch\\test-source\\深入理解JVM-学习笔记.txt"; String[] keys = {"加载", "接口", "使用", "初始化", "文件"}; String content = FileUtils.readFileToString(new File(oldfile), "utf-8"); int count = 0; LocalTime start = LocalTime.now(); for (String key : keys) { for (int i = 0, length = content.length(), keyLength = key.length(); i + keyLength <= length; i++) { if (content.substring(i, i + keyLength).equals(key)) { count++; } } } Duration between = Duration.between(start, LocalTime.now()); System.out.println("count1: " + count + " between1: " + between); int sum = 0; LocalTime start2 = LocalTime.now(); for (String key : keys) { String temp = content; while (temp.contains(key)) { temp = temp.substring(temp.indexOf(key) + key.length()); sum++; } } Duration between2 = Duration.between(start2, LocalTime.now()); System.out.println("count2: " + sum + " between2: " + between2); } }
测试结果:
count1: 262890 between1: PT0.663S
count2: 262890 between2: PT4M55.925S
分类:
性能优化
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构