贪婪模式(Greedy):
数量表示符默认采用贪婪模式,除非另有表示。贪婪模式的表达式会一直匹配下去,直到无法匹配为止。如果你发现表达式匹配的结果与预期的不符,很有可能是因为——你以为表达式只会匹配前面几个字符,而实际上它是贪婪模式,所以会一直匹配下去。
贪婪与非贪婪,加上?为非贪婪:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
var s = '1023000' .match(/(\d+)(0*)/); s [ "1023000" , "1023000" , "" ] var s = '1023000' .match(/^(\d+)(0*)$/); s [ "1023000" , "1023000" , "" ] var s = '1023000' .match(/^(\d+?)(0*)$/); s [ "1023000" , "1023" , "000" ] var s = '1023000' .match(/(\d+?)(0*)/); s [ "10" , "1" , "0" ] |
java 正则表达式默认用的是greedy贪婪匹配模式既是这种类型(.*)的最长匹配,如果需要最短匹配则改为(.*?)即是勉强匹配模式。
原理分析:
如果是贪婪匹配模式,正则表达式引擎会一直匹配到字符串最后,当匹配为false时,通过
回溯的方式,倒退找到倒数第一个匹配位置,返回匹配结果
如果是勉强匹配模式,正则表达式引擎会匹配到符合pattern的末尾位置那个字符,然后再往后走一步,发现匹配为false,又回溯到找到回退的最近一个匹配为true的位置,返回结果。
看代码:
例一:
1
2
3
4
5
6
|
public void test51(){ String str = "aaa\"bbb\"ccc\"ddd\"eee" ; System.out.println(str); str = str.replaceAll( "\"(.*)\"" , "@" ); System.out.println(str); } |
输出:
1
2
|
aaa"bbb"ccc"ddd"eee aaa@eee |
例二:
1
2
3
4
5
6
7
8
9
|
@Test public void test52(){ String str = "aaa\"bbb\"ccc\"ddd\"eee" ; System.out.println(str); str = str.replaceAll( "\"(.*?)\"" , "@" ); System.out.println(str); } |
输出:
1
2
|
aaa"bbb"ccc"ddd"eee aaa@ccc@eee |