js中的字符串长度
众所周知String对象的length属性能够返回字符串的长度,不管字符是单字节还是双字节,都作为一个长度单位来计算。因此要准确的获取字符长度,必须通过手工来写。
下面介绍两种方式:
1、循环遍历字符串,根据字符的编码,来判断当前字符是双字节还是单字节,然后递加字符串的字节数。
<span style="font-size:14px;">String.prototype.lengthSingle = function(str){ var b = 0; for(var i=0,l=str.length;i<l;i++){ if(this.chartCodeAt(i)>255){ b +=2; }else{ b++; } } return b; }</span>
或者根据escape来判断是否为单字节还是双字节。escape的作用是对 String 对象编码以便它们能在所有计算机上可读。
escape 方法返回Unicode格式的字符串值。所有空格、标点、重音符号以及 其他非 ASCII 字符都用 %xx 编码代替,其中 xx 等于表示该字符的十六进制数。例如,空格返回的是 "%20 " 。 字符值大于 255 的以 %uxxxx 格式存储。 因此可以通过使用escape方法后返回的值的长度来确定是单字节还是双字节。
<pre name="code" class="javascript"><span style="font-size:14px;">String.prototype.lengthSingle = function(str){ var b = 0; for(var i=0,l=str.length;i<l;i++){ var c = this.charAt(i); if(escape(c).length>4){ b+=2; }else if(c!=" "){ b++; } } return b; }</span>
亦可以使用正则表达式来判断为单字节还是双字节。
<pre name="code" class="javascript"><span style="font-size:14px;">String.prototype.lengthSingle = function(str){ var b = 0; for(var i=0,l=str.length;i<l;i++){ var c = this.charAt(i); if(/^[u0000-u00ff]$/.test(c)){ b++; }else{ b+=2; } } return b; }</span>
第二种方式,则是将字符串中的所有双字节字符,使用**代替,然后再统计长度。由于会使用到两次遍历,因此效率没有第一种高。故不描述了。
声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。
- 上一篇: PHP源码之数组的内部实现
- 下一篇: nodejs String