牛骨文教育服务平台(让学习变的简单)
博文笔记

php正则表达式 剔除字符串中的除了汉字的字符(只保留汉字)

创建时间:2014-05-22 投稿人: 浏览次数:177
<?php 
//提取字符串中的汉字其余信息剔除
header("Content-type: text/html; charset=utf-8");
$str="f龙,真 。,."; 
preg_match_all("/[x{4e00}-x{9fff}]+/u", $str, $matches);
$str = join("", $matches[0]);
echo $str;
?> 


    PHP利用正则表达式如何匹配出一段字符串中的中文,对于这个问题,网上也有很多代码,但是大部分都存在纰漏,所以下面为大家提供真正能够匹配出中文的代码。分两种编码形式:

1)utf-8的编码格式,匹配中文代码如下:

<?php
    $str = "utf-8下匹配出中文字符串";
    $preg = "/[x{4e00}-x{9fa5}]+/u";
    if(preg_match_all($preg,$str,$matches)){
        print_r($matches);
    }
?>

2)gb2312的编码格式,匹配中文字符串代码如下:

<?php
    $str = "gb2312下匹配出中文字符串";
    $preg = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";
    if(preg_match($preg,$str,$matches)){
        print_r($matches);
    }
?>


声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。