追逐梦想

临渊羡鱼,不如退而结网
posts - 8, comments - 8, trackbacks - 0, articles - 0

[转]wchar_t与char转换

Posted on 2008-01-08 11:07 寒蝉 阅读(1206) 评论(2)  编辑 收藏 引用 所属分类: C++读书笔记
环境:Dev cpp 平台i386 
    C++标准中,wchar_t是宽字符类型,每个wchar_t类型占2个字节,16位宽。汉字的表示就要用到wchar_t 。char,我们都知道,占一个字节,8位宽。
其实知道了这个以后,要在wchar_t 和 char两种类型之间转换就不难实现了。wchar_t 转换为char 的代码如下: 
有如下的wchar_t和char变量:
wchar_t w_cn = '中'; char c_cn[2] = {'0'} ;
char *C2W(wchar_t w_cn , char c_cn[2])
{    //following code convert wchar to char 
      c_cn[0] = w_cn >> 8 ;
      c_cn[1] = w_cn ;
      c_cn[2] = '\0';
      return c_cn ;
}
  其中需要注意的是一个16位的wchar_t需要用两个8位的char来存储之。我们可以发现另外一个问题,wchar_t的高位字节应该存储在char数组的低位字节。
(这里没有仔细研究了,觉得怪怪的)。
 这是完成了wchar_t到char的转化,char到wchar_t的转换类似。






C++中,你要想这样:cout<<w_cn<<endl;打印wchar_t,那是不行的。why?我想是wchar_t类型没有重载<<运算符吧。要显示,我的方法是:
string cn(c_cn);

cout<<cn<<endl;
这样就能正确的打印wchar_t字符了。是不是感觉好像做了好多事,但是完成的却是很简单的事情?呵呵,其实我也有同感,但是没有办法。更简单的办法,当然是直接用API(我一个是懒的去找了,二一个自己动手转换有些东西看的更清楚咯),但是这样的转换更灵活,
在实际中应该会用到的。 有了以上的基础,下面给出wchar_t字符串到char字符串的转换代码:
char *W2C(const wchar_t *pw , char *pc)







{
//cout<<*pw<<endl;    //这样是不能正确显示的,你可以试试看显示的是什么
      *pc++ = *pw >> 8 ;
      *pc = *pw ;
      return 0 ;

char *wstr2cstr(const wchar_t *pwstr , char *pcstr, size_t len)
{     char *ptemp = pcstr ;
      if(pwstr!=NULL && pcstr!=NULL)
      {  size_t wstr_len = wcslen(pwstr) ;
          len = (len > wstr_len ) ?    wstr_len : len ;
      while( len -- > 0)
      {
          W2C(pwstr , pcstr);
          pwstr++ ;
          pcstr +=2 ;      //和我们开始说的一样+2,不是+1
      }
          *pcstr = '\0';
          return ptemp ;
      }
      return 0 ;
}    
对上面的代码进行测试:
int main(int arg , char *argv[])
{
      wchar_t pwstr[] = {'我' , '是' , '中' , '国' , '人'};
      char *pcstr = (char *)new char[2 * wcslen(pwstr)+1] ;
      memset(pcstr , 0 , 2 * wcslen(pwstr)+1 );
      wstr2cstr(pwstr , pcstr , wcslen(pwstr)) ;
      str.assign (pcstr);
      cout<<str<<endl;
      delete []pcstr ;
}

Feedback

# re: [转]wchar_t与char转换  回复  更多评论   

2008-01-08 16:40 by <a href=http://minidx.com>minidxer</a>
相同的编码的这样转没问题,不同的话就有问题的
比如gb的转UTF16

# re: [转]wchar_t与char转换  回复  更多评论   

2008-01-20 19:41 by jsjkandy
对于编码还刚刚处于学习阶段,不知道您是否可以给我介绍几篇文章,或者给讲一些不同的 编码在不同的平台上进行移植的一些问题。呵呵。

标题  
姓名  
主页
验证码 *
内容(提交失败后,可以通过“恢复上次提交”恢复刚刚提交的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
[使用Ctrl+Enter键可以直接提交]
相关链接:
网站导航: