Mysql以utf8存储gbk输出的实现

一个站有可能经历gb2312(gbk,big5)到utf8的转换过程,其中会遇到很多的问题。站点太庞大了怎么办呢,只能一步步来了。要是能在极少改动前端代码的情况下,先完成数据的转换将会使整件事情容易得多。经过几天测试终于发现,Mysql以utf8存储gbk输出是可以实现的。mysql4.1后都有个特性,可以指定当前客户端连接所使用的字符集,mysql默认都是latin1,或由mysql server端配置的字符集进行连接校对。我使用utf8_general_ci来创建字段。

DB:

SQL代码:
  1. CREATE TABLE `table` (  
  2. `id` INT( 10 ) NOT NULL ,  
  3. `nameVARCHAR( 50 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,  
  4. INDEX ( `g_id` )  
  5. ) ENGINE = innodb CHARACTER SET utf8 COLLATE utf8_general_ci; 

php:
存储操作指定使用utf8字符集进行连接校对,读取操作指定使用gbk字符集进行连接校对。

PHP代码:
  1. <?php  
  2.     // Select DB And Set Link Use UTF8  
  3.     function _select_db_utf()  
  4.     {  
  5.     mysql_select_db($this->db_name, $this->db_link);  
  6.   
  7.   
  8.     // init character  
  9.     mysql_query("SET NAMES utf8"$this->db_link);  
  10.     mysql_query("SET CHARACTER SET utf8"$this->db_link);  
  11.     mysql_query("SET COLLATION_CONNECTION='utf8_general_ci'"$this->db_link);  
  12.   
  13.   
  14.     return true;  
  15.     }  
  16.   
  17.   
  18.     // Select DB And Set Link Use GBK  
  19.     function _select_db_gb()  
  20.     {  
  21.     mysql_select_db($this->db_name, $this->db_link);  
  22.   
  23.   
  24.     // init character  
  25.     mysql_query("SET NAMES gbk"$this->db_link);  
  26.     mysql_query("SET CHARACTER SET gbk"$this->db_link);  
  27.     mysql_query("SET COLLATION_CONNECTION='gbk_chinese_ci'"$this->db_link);  
  28.   
  29.   
  30.     return true;  
  31.     }  
  32. ?>

需要注意几点:
1. mysql必须把gbk,gb2312,utf8等字符集编译进去。
2. 入库的数据内容必须保证是最正确的UTF8编码。
3. 存储和读取操作要指定正确的字符集进行连接校对。

要是前端代码操作数据入库不能以UTF8进行,则需要对字符进行转码了。(例如用AJAX提交的数据便是正确的UTF8,这时是不用转换的。)

因为mb_string是PHP所支持字符最全的,而iconv比它稍差一点,mb_string并不能完全支持一些特殊字符的转码,所以目前为止都没有完美的转码方法。

再次对mb_string和iconv进行比较:

mb_string:
1. 所支持字符最全
2. 内容自动识别编码,不需要确定原来字符的编码,但是执行效率比iconv差太多
3. $content = mb_convert_encoding($content, "UTF-8", "GBK,GB2312,BIG5");(顺序不同效果也有差异)

iconv:
1. 所支持字符不全
2. 需要确定原来字符的编码,但在确定编码的情况下执行效率比mb_convert_encoding高
3. $content = iconv("GBK", "UTF-8", $content);

关键词: 技术 , php

上一篇: HTML Earrings.HTML耳环.
下一篇: 技术计划

相关文章
访客评论
#1
回复 4mxku 2007-06-08, 09:17:33
记录下
结合document.write("<xmp>"+"加密字符串">来构造解密程序
#2
回复 4mxku 2007-06-08, 09:18:51
http://www.1v1.name/show-208-1.html
#3
回复 kiki 2007-06-17, 13:37:15
引用 4mxku 说过的话:
http://www.1v1.name/show-208-1.html



什么东东
发表评论

评论内容 (必填):