正则表达式跨行非贪婪多组匹配

<div>

  <a>

</div>

<div>

  <c>

</div>

<div>

  <f>

</div>


找出div的内容,java代码如下:

Pattern p = Pattern.compile("(?s)<div>(.+?)</div>");

String  s = "<div>\r\n<a>\r\n<b>\r\n</div>\r\n<div>\r\n<c>\r\n<d>\r\n</div>\r\n<div>\r\n<e>\r\n<f>\r\n</div>";

Matcher m = p.matcher(s);

while (m.find()) {

    int cnt = m.groupCount();

    for (int i = 1; i <= cnt; i++) {

        System.out.println(m.group(i));

    }

}


1、跨行,表达式使用(?s),或Pattern.compile(, Pattern.DOTALL);
2、非贪婪,Reluctant,在括号匹配组中加号后加上问号;
3、多组匹配,Perl使用g标志请求恢复最后匹配丢失的匹配。此功能是由Matcher类显式提供:重复执行find方法调用可以恢复丢失的最后匹配,如代码使用while循环。

你可能感兴趣的:(java,正则表达式)