牛骨文教育服务平台(让学习变的简单)
博文笔记

正则表达式:字符串中连续重复字符串的识别和替换

创建时间:2016-12-20 投稿人: 浏览次数:5523

今天编程的时候遇到一个正则表达式查找和替换的问题:对于字符串连续出现的字符,用“(重复字符)”替换。我想到用正则表达式比较高效。

对于字符串中的连续重复的字符,正则表达式是:

(.)1+

以下是程序的片段:

 Pattern pattern = Pattern.compile("(.)\1+");
 Matcher matcher = pattern.matcher("111234445466");
 //sb 缓冲区作为存储替换后的结果
 StringBuffer sb = new StringBuffer();
 //用正则表达式的find函数去判断,有没有匹配的结果集
 while (matcher.find()) {
    //match.group(0) 是匹配的字符串,比如111234445466中的111
    //match.group(1) 是匹配的字符串的单个字符,比如111234445466中的111中的1
    String repeat = matcher.group(1);
    //appendReplacement用第二个参数去替换匹配成功的子串,并把结果存放在sb中,前面未匹配成功的也会放进去,后面的未匹配成功的不会放进去。例如:11123444546634 最后会替换成(1)23(4)54(6)
    matcher.appendReplacement(sb, "("+repeat+")" );
 }
 //把后面未匹配成功的附加到sb上,例如:11123444546634 最后会替换成(1)23(4)54(6)34
 matcher.appendTail(sb);
 return sb.toString();
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。