正则表达式巧妙实现字符串去重
今天上午看到新浪的一个面试题:
- 将字符串 "adsfjjbkk"处理,就是连一起重复的字符删除,变成“adsfjbk”,写出实现代码。
对于去除简单的相邻重复的情况,我们可以用正则实现如下:
<span style="font-size:14px;">var str = "adsfjjbkk"; // 1匹配第一个子串 // 只去除连续重复 console.log(str.replace(/(.)(1)+/g,function($1,$2,$3){ return $2; }));// adsfjbk</span>
但是,如果现在需求变了,要求只保留重复字符串的第一次出现的串,如对于字符串"adaaasfjjjbkk"去重后需为:
"adsfjbk"
我们该如何实现呢?
注意到1是匹配第一个子表达式(正则中第一个括号内的值),replace()方法中的回调函数的参数第一个为匹配的整个子串,而从第二个开始一次为匹配的第一个、第二个......子表达式匹配的值。只要稍微变更一下,就能得出结果。
代码实现如下:
var str = "adaaasfjjjbkk"; // 只保留第一次出现的重复串 console.error(str.replace(/(.).*(1)/g,function($1,$2,$3){ // 第一个参数匹配整个匹配值,从第二个开始是匹配的子串 $1 = $2+$1.substring(1).replace(new RegExp($2,"g"),""); return $1; }));
如果结合js里的hash来实现,其实也很简单。类似于统计一个数组里每个字符或字符串出现的次数一样,实现如下:
var str = "adaaasfjjjbkk"; var helper = {}, res = ""; for(var i=0,sub;sub=str.charAt(i);i++){ if(helper[sub]){ helper[sub] = ++helper[sub]; continue; } helper[sub] = 1; res += sub; } console.info(res);
但是始终你会感觉到,用正则实现就是爽!
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。
- 上一篇: 正则表达式——匹配多个字符串之一
- 下一篇: 正则表达式高级用法(分组与捕获)