您的位置:首页 >正则表达式中问号(?)的正确用法详解
发布于2026-05-03 阅读(0)
扫一扫,手机访问
提起正则表达式里的问号“?”,很多朋友的第一反应可能是“匹配零次或一次”。这么说没错,但这只是它能力的冰山一角。实际上,这个小小的符号在正则引擎里扮演着多重角色,从改变匹配模式到控制捕获行为,甚至能进行复杂的条件判断。今天,我们就来系统地梳理一下它的几种关键用法。
这是问号最基础、最直观的用法。当它直接跟在某个子表达式后面时,其作用就相当于{0,1},表示“前面的元素可以出现,也可以不出现”。
举个例子,正则表达式abc(d)?既能匹配"abc",也能匹配"abcd"。这里的(d)?就是在说:“字母d可有可无”。这种用法在匹配可能存在的后缀(如英文单词的复数形式)时非常方便。
贪婪与非贪婪,是理解正则匹配行为的一个关键概念。简单来说,贪婪模式会尽可能多地吃掉符合条件的字符,而非贪婪模式则相反,它以满足最低要求为原则,匹配得越少越好。
默认情况下,正则表达式处于贪婪模式。而当问号紧跟在其他量词(如*、+、?、{n,}等)之后时,它就变成了一个模式切换器,将贪婪模式转为非贪婪模式。
比如,用正则表达式\S+c去匹配字符串"aaaacaaaaaaac",由于\S+会贪婪地匹配所有非空字符,直到最后一个c才停止,所以最终匹配到的是整个字符串"aaaacaaaaaaac"。如果使用\S+?c,+?这个组合就表示“以非贪婪方式匹配一个或多个非空字符”,引擎会一见满足条件的c就停下,因此优先匹配到的结果是"aaaac"。
使用圆括号()进行分组时,被括起来的部分所匹配到的文本通常会被“捕获”并暂存起来,后续可以通过反向引用或程序接口来获取。这些缓存的分组内容,有时也会占用额外的性能开销。
如果某个分组的目的仅仅是为了组合元素或应用量词,而不需要提取它的匹配结果,那么就可以在开括号后加上?:,将其指定为“非捕获分组”。这样,分组的功能依然有效,但匹配的内容不会被缓存。
看下面这段代码对比就一目了然了:
// 普通捕获分组
var testReg=/(a+)(b*)c/;
testReg.test('aaaabbbccc'); // 输出true
console.log(RegExp.$1); // 输出"aaaa"
console.log(RegExp.$2); // 输出"bbb"
// 使用(?:)的非捕获分组
var testReg2=/(a+)(?:b*)c/;
testReg2.test('aaaabbbccc'); // 输出true
console.log(RegExp.$1); // 输出"aaaa"
console.log(RegExp.$2); // 输出"" (第二个分组未被捕获)
可以看到,在第二个例子中,(?:b*)分组参与了匹配,但它的内容"bbb"并没有被存入RegExp.$2中。
断言是正则表达式中一种高级且强大的功能。它不直接匹配字符,而是作为一个条件,判断目标位置的左侧或右侧是否满足某种模式。这就像在说:“我要找这样一个位置,它的前面(或后面)必须是/不能是某种样子”。
断言主要有以下四种形式,它们都以问号开头:
(?=pattern) |
正向先行断言。匹配一个位置,这个位置的后面必须紧跟着 |
(?!pattern) |
负向先行断言。匹配一个位置,这个位置的后面必须不是 |
(?<=pattern) |
正向后行断言。匹配一个位置,这个位置的前面必须紧跟着 |
(? |
负向后行断言。匹配一个位置,这个位置的前面必须不是 |
关键在于,断言本身匹配的只是这个“位置条件”,它消耗的字符长度为零,因此断言表达式中的内容不会出现在最终的匹配结果里。
我们用代码来验证一下:
// 正向先行断言:匹配后面是"123"的"test"
var testReg=/test(?=123)/;
var result=testReg.exec('test123');
console.log(result[0]) // 输出 "test" (不包含123)
var result2=testReg.exec('test12');
console.log(result2) // 输出 null
// 正向后行断言:匹配前面是"123"的"test"
var testReg2=/(?<=123)test/;
var result3=testReg2.exec('123test');
console.log(result3[0]) // 输出 "test" (不包含123)
var result4=testReg2.exec('12test');
console.log(result4) // 输出 null
负向断言(?!和?)的逻辑正好相反,它们要求在指定方向上不能出现断言模式:
// 负向先行断言:匹配后面不是"123"的"test"
var testReg=/test(?!123)/;
var result=testReg.exec('test123');
console.log(result) // 输出 null (因为后面是123,断言失败)
var result2=testReg.exec('test12');
console.log(result2[0]) // 输出 "test" (因为后面是12,断言成功)
// 负向后行断言:匹配前面不是"123"的"test"
var testReg2=/(?
可以看到,断言为我们提供了极其精准的位置控制能力,是进行复杂文本匹配和验证时的利器。
参考资料:
https://blog.csdn.net/u014762221/article/details/68953155
https://www.jianshu.com/p/08c2fa742c1b
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9