tbwshc

tbw

C++博客 :: 首页 :: 联系 :: 聚合

:: 管理

95 Posts :: 8 Stories :: 3 Comments :: 0 Trackbacks

常用链接

留言簿(4)

我参与的团队

随笔分类

oracle(5)

随笔档案

文章档案

新闻档案

tbw淘宝商城

tbw淘宝商城-首页
tbw淘宝商城首页是集tbw淘宝网商城女装,男装,内衣,男鞋,女鞋,运动鞋,童装,手表,饰品,化妆品,手机,相机为一体的购物网站,tbw淘宝商城首页给推荐你最好淘宝店铺.

搜索

阅读排行榜

评论排行榜

UTF-8 GBK UTF8 GB2312 之间的区别和关系

这两天做项目又遇到了程序员最频繁遇到的问题之一————乱码问题

这次是tomcat上的，解决后又顺便复习了下，在这与大家分享下

UTF-8：Unicode TransformationFormat-8bit，允许含BOM，但通常不含BOM。是用以解决国际上字符的一种多字节编码，它对英文使用8位（即一个字节），中文使用24为（三个字节）来编码。UTF-8包含全世界所有国家需要用到的字符，是国际编码，通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的tb浏览器上显示。如，如果是UTF8编码，则在外国人的英文IE上也能显示中文，他们无需下载IE的中文语言支持包。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的，即不论中、英文字符均使用双字节来表示，为了区分中文，将其最高位都设定成1。GBK包含全部中文字符，是国家编码，通用性比UTF8差，不过UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换：

GBK、GB2312－－Unicode－－UTF8

UTF8－－Unicode－－GBK、GB2312

对于一个网站、论坛来说，如果英文字符较多，则建议使用UTF－8节省空间。不过现在很多论坛的插件一般只支持GBK。
个编码的区别详细解释
简单来说，unicode，gbk和大五码就是编码的值，而utf-8,uft-16之类就是这个值的表现形式．而前面那三种编码是一兼容的，同一个汉字，那三个码值是完全不一样的．如＂汉＂的uncode值与gbk就是不一样的，假设uncode为a040，gbk为b030，而uft-8码，就是把那个值表现的形式．utf-8码完全只针对uncode来组织的，如果ＧＢＫ要转ＵＴＦ－８必须先转uncode码，再转utf-8就ＯＫ了．

posted on 2012-06-25 13:16 tbwshc 阅读(1576) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理