PHP转换编码问题GBK/UTF-8 – 上地五街的忧伤

在实际项目中，有时候会遇到远程接收到的编码，或者数据库里取出的编码与实际文件编码不一致的情况，这样就非常容易出现乱码，如果简单的用iconv函数转码的话，有时又无法保证对方传过来的一定是某种编码。

举个例子：我现在的项目开发编码是GBK，而又有很多地方需要用JSON来接收、发送数据，接收到的数据一定是UTF-8编码（非UTF-8中文无法encode和decode），但我需要把接收来的数据用在我们的系统中，这样就必须转码一次，当我们需要发送JSON数据给其他接收者的时候，又必须将编码从GBK转成UTF-8。超级麻烦，而且极易出错，因为我们无法特别准确的定位文本现在的编码。于是诞生了下面两个函数。

这两个函数均可以接收1：字符串、2：一维数组、3：多维数组，并将转码后的内容原样返回去。

在这里我想多唠叨一句，可能会给很多经验不是很丰富的程序员节省很多时间。

当我们在进行字符串拼接的时候，一定要把编码转一致了再拼接，否则可能会出现一个字符串，前半部分是UTF-8，后半部分是GBK，这样无论我们怎样转码，都会存在乱码的。

当然还有一个更好的解决办法，就是我们在建立项目的时候，统一建成UTF-8编码，虽然对于中文网站，GBK会节省空间，但是现在硬盘都是白菜价了，没有人再在意这些了。而且使用了UTF-8编码，你再也不用担心外国朋友访问到你的网页会全是乱码了。再而且，现在网站通过接口交互的需求是越来越大，用UTF-8也避免了不少麻烦~~~

/**
 * 将非GBK字符集的编码转为GBK
 *
 * @param mixed $mixed 源数据
 *
 * @return mixed GBK格式数据
 */
function charsetToGBK($mixed)
{
    if (is_array($mixed)) {
        foreach ($mixed as $k => $v) {
            if (is_array($v)) {
                $mixed[$k] = charsetToGBK($v);
            } else {
                $encode = mb_detect_encoding($v, array('ASCII', 'UTF-8', 'GB2312', 'GBK', 'BIG5'));
                if ($encode == 'UTF-8') {
                    $mixed[$k] = iconv('UTF-8', 'GBK', $v);
                }
            }
        }
    } else {
        $encode = mb_detect_encoding($mixed, array('ASCII', 'UTF-8', 'GB2312', 'GBK', 'BIG5'));
        //var_dump($encode);
        if ($encode == 'UTF-8') {
            $mixed = iconv('UTF-8', 'GBK', $mixed);
        }
    }
    return $mixed;
}


/**
 * 将非UTF-8字符集的编码转为UTF-8
 *
 * @param mixed $mixed 源数据
 *
 * @return mixed utf-8格式数据
 */
function charsetToUTF8($mixed)
{
    if (is_array($mixed)) {
        foreach ($mixed as $k => $v) {
            if (is_array($v)) {
                $mixed[$k] = charsetToUTF8($v);
            } else {
                $encode = mb_detect_encoding($v, array('ASCII', 'UTF-8', 'GB2312', 'GBK', 'BIG5'));
                if ($encode == 'EUC-CN') {
                    $mixed[$k] = iconv('GBK', 'UTF-8', $v);
                }
            }
        }
    } else {
        $encode = mb_detect_encoding($mixed, array('ASCII', 'UTF-8', 'GB2312', 'GBK', 'BIG5'));
        if ($encode == 'EUC-CN') {
            $mixed = iconv('GBK', 'UTF-8', $mixed);
        }
    }
    return $mixed;
}

神马？！copy出来格式全乱了？！

别急，源码在这里：charset.rar

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30