PHP读取文件中文乱码UTF-8;

创建时间：2014-09-12 投稿人：浏览次数：6033

$opts = array(
    "file" => array(
        "encoding" => "utf-8"
    )
);
$opts = array("http" => array("encoding" => "utf-8"));
$ctxt = stream_context_create($opts);
$content = file_get_contents($filePath, FILE_TEXT, $ctxt);

最简单的就是将GF2312→UTF-8

$str = iconv("gb2312", "utf-8", $str);

不管用的

$content = mb_convert_encoding($content, "UTF-8", "auto");

******************************************丑陋的分割线来告诉大家上面的不好的：下面的才是正确的方法···哈哈···**********************************************************

                        define("UTF32_BIG_ENDIAN_BOM", chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));
                        define("UTF32_LITTLE_ENDIAN_BOM", chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));
                        define("UTF16_BIG_ENDIAN_BOM", chr(0xFE) . chr(0xFF));
                        define("UTF16_LITTLE_ENDIAN_BOM", chr(0xFF) . chr(0xFE));
                        define("UTF8_BOM", chr(0xEF) . chr(0xBB) . chr(0xBF));

                        $text = file_get_contents($newPath);
                        $first2 = substr($text, 0, 2);
                        $first3 = substr($text, 0, 3);
                        $first4 = substr($text, 0, 3);
                        $encodType = "";
                        if ($first3 == UTF8_BOM)
                            $encodType = "UTF-8 BOM";
                        else if ($first4 == UTF32_BIG_ENDIAN_BOM)
                            $encodType = "UTF-32BE";
                        else if ($first4 == UTF32_LITTLE_ENDIAN_BOM)
                            $encodType = "UTF-32LE";
                        else if ($first2 == UTF16_BIG_ENDIAN_BOM)
                            $encodType = "UTF-16BE";
                        else if ($first2 == UTF16_LITTLE_ENDIAN_BOM)
                            $encodType = "UTF-16LE";

                        $content = file_get_contents($newPath);

                        $content = iconv($encodType, "utf-8", $content);

终极版·····

$text = file_get_contents($filePath);
                        //$encodType = mb_detect_encoding($text);
                        define("UTF32_BIG_ENDIAN_BOM", chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));
                        define("UTF32_LITTLE_ENDIAN_BOM", chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));
                        define("UTF16_BIG_ENDIAN_BOM", chr(0xFE) . chr(0xFF));
                        define("UTF16_LITTLE_ENDIAN_BOM", chr(0xFF) . chr(0xFE));
                        define("UTF8_BOM", chr(0xEF) . chr(0xBB) . chr(0xBF));
                        $first2 = substr($text, 0, 2);
                        $first3 = substr($text, 0, 3);
                        $first4 = substr($text, 0, 3);
                        $encodType = "";
                        if ($first3 == UTF8_BOM)
                            $encodType = "UTF-8 BOM";
                        else if ($first4 == UTF32_BIG_ENDIAN_BOM)
                            $encodType = "UTF-32BE";
                        else if ($first4 == UTF32_LITTLE_ENDIAN_BOM)
                            $encodType = "UTF-32LE";
                        else if ($first2 == UTF16_BIG_ENDIAN_BOM)
                            $encodType = "UTF-16BE";
                        else if ($first2 == UTF16_LITTLE_ENDIAN_BOM)
                            $encodType = "UTF-16LE";

                        //下面的判断主要还是判断ANSI编码的·
                        if ($encodType == "") {//即默认创建的txt文本-ANSI编码的
                            $content = iconv("GBK", "UTF-8", $text);
                        } else if ($encodType == "UTF-8 BOM") {//本来就是UTF-8不用转换
                            $content = $text;
                        } else {//其他的格式都转化为UTF-8就可以了
                            $content = iconv($encodType, "UTF-8", $text);
                        }

以上的终极版·可以适应中文操作windows系统建立的ANSI``````````````UTF-8`````````Unicode`````的txt文本····

别的编码的待补充···

还是那句话···：····

↓

欢迎交流··········

O(∩_∩)O

声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。

上一篇： file_get_contents模拟浏览器访问的时候乱码
下一篇： php 抓取页面乱码

热门文章: CTF writeup 2_南邮网络攻防训...; SSM框架——详细整合教程（...; Linux Shell脚本编程－－curl命...; HttpClient使用详解; Java面试题全集（上）; JAVA设计模式之单例模式; java.lang.OutOfMemoryError: PermGen ...; TCP协议中的三次握手和四次...; form表单的两种提交方式，su...; String,StringBuffer与StringBuilder...

最新文章: Java之品优购课程讲义_day20（7）; 剑指 Offer - 8：跳台阶; Netty权威指南_札记02_NIO编程; mysql时间属性之时间戳和datetime之...; 虚拟现实或许可以拯救古埃及的“...; spring cloud服务注册中心eureka---集群...; Java SE 第六章; HTTP请求+数据库; HIDL学习笔记之HIDL C++（第二天）; ubuntu系统下指定tomcat运行时为JDK1.8...