您的位置:首页 >如何在 Java 中利用数组实现简单的字符串匹配 BF 算法并分析其最坏情况性能
发布于2026-05-04 阅读(0)
扫一扫,手机访问

说起字符串匹配,BF(Brute Force,暴力匹配)算法绝对是绕不开的起点。它的核心思路非常直白:把模式串在主串上从头到尾“滑”一遍,在每个可能的位置都尝试一次逐字符的“硬核对”。在Ja va里,如果直接把字符串转成char[]数组来操作,能省去反复调用String.charAt()方法的开销,让这个朴素的算法跑得更利索一些。
假设主串是字符数组s,模式串是p,长度分别是n和m。整个匹配过程,其实就是检查从i = 0到i = n - m的每一个起始位置:
i,都从j = 0开始,逐个比较s[i+j]和p[j]。s[i+j] != p[j],说明这次对齐失败了,i就加1,挪到下个位置重头再来。j能一路顺利地走到m,意味着模式串的每一个字符都匹配上了,这时直接返回i,它就是首次匹配成功的起始索引。i都试遍了还没成功,那就返回-1宣告匹配失败。用代码来呈现,大概是下面这个样子:
public static int bfSearch(char[] s, char[] p) {
int n = s.length, m = p.length;
if (m == 0) return 0;
if (n < m) return -1;
for (int i = 0; i <= n - m; i++) {
int j = 0;
while (j < m && s[i + j] == p[j]) {
j++;
}
if (j == m) return i;
}
return -1;
}
想深入掌握Ja va?立即学习“Ja va免费学习笔记(深入)”。
BF算法最让人诟病的地方,就是它的时间复杂度在最坏情况下会达到O(n × m)。那么,什么情况会触发这个“最坏”呢?答案是:每次尝试都让你看到希望,直到最后一刻才让你失望。
"aaaaaa"。m−1位都和主串匹配,唯独最后一位不同,比如"aaab"。i(总共有n−m+1个),算法都要执行m−1次成功的比较,然后在最后一次比较时失败。总的字符比较次数大约就是(n−m+1) × m。举个例子就清楚了:设 s = "aaaaaaaa", p = "aaab"(这里n=8, m=4)。算法需要检查 i=0 到 5 共6个位置,每一轮都要比较4次字符(前3次成功,第4次失败),总共就是 6 × 4 = 24 次比较。字符串一长,这个计算量就相当可观了。
BF算法效率低下的根源在于“健忘”:之前比较过的信息,在失配后就被完全抛弃了,下一次尝试又得从头开始。这也正是KMP、BM这些更高级算法所要解决的核心问题。
while (j < m && s[i + j] == p[j])已经隐含了对数组越界的控制。p[0]在主串中是否存在。但这属于“小聪明”,无法改变算法最坏情况下的时间复杂度级别。String.indexOf()方法是更明智的选择。OpenJDK的底层实现已经针对不同场景做了高度优化,混合了多种策略(包括BM算法的变种),其效率远非手写的BF算法可比。尽管BF算法在性能上不占优势,但它作为字符串匹配领域的“第一课”,其价值不可替代。通过数组来实现它,能让我们无比清晰地看到其“回溯式扫描”的本质,也让我们直观地感受到在最坏情况下,那些重复比较是多么的冗余。掌握BF,根本目的是为了给理解KMP算法中巧妙的next数组做铺垫——明白BF为何“笨”,才能懂得KMP为何能“跳”,而后者,才是构建工业级字符串匹配能力的基石。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9