php多字节编码字符长度检测
/**
*@bkInfo 1、 GB2312编码用两个字节(8位2进制)表示一个汉字
* 2、 GBK采用双字节表示,总体编码范围为8140-FEFE
* 3、 Big5在台湾、香港与澳门地区,使用的是繁体中文字符集,
* 1984年,台湾五大厂商宏碁、神通、佳佳、零壹以及大众一同制定了一种繁体中文编码方案,
* 因其来源被称为五大码,英文写作Big5,每个字符统一使用两个字节存储表示
* 4、UTF-8对中文支持是一个汉字占3个字节
* @author caifangjie
* @date 2015-07-13
* @desc 多字节长度检测
*
*/
function mbLength($str)
{
$len = strlen($str);
$currentEncoding = strtolower(mb_detect_encoding($str));
$i=0;
for(;$i<$len;) {
//判断是否为多字节
if(ord(substr($str, $i, 1)) > 0xa0) {
if($currentEncoding == "utf-8") {
$i=$i+3;
} else if(in_array($currentEncoding,array("gbk", "gb2312", "big5"))) {
$i=$i+2;
}
} else {
$i++;
}
}
return $i;
}声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。
- 上一篇: PHP判断中文字符串的长度和字节长度
- 下一篇: utf-8的中文是一个汉字占三个字节长度吗?
