第二次遇到这个问题了,搞了几个小时,真是可恶。

从UNICODE 文本中读取文本信息,怎么的显示都是乱码,连着试验了好多种读的方法都不对,最后发现读出来的数据是正确的,在解析的时候出错了。我使用了wcstombs()这个函数,可是每次转换之后它返回的值都是-1。

原因在于,代码页没有进行设置。需要调用locale.h 中定义的一个函数设置默认的代码页。贴点代码放在这里,下次别忘了。

 HANDLE hFile;
 BYTE   buffer[1024]={0};
 WCHAR  wchbuffer[1024];
 char   chbuffer[1024],chmsg[1024];
 DWORD  dwNeedRead=1024;
 DWORD  dwRead=0;
 int    nRet;
 FILE *fp;
 hFile=CreateFile("unicode1.txt",GENERIC_READ,NULL,NULL,OPEN_EXISTING,FILE_ATTRIBUTE_NORMAL,NULL);
 if(hFile==INVALID_HANDLE_VALUE){
  MessageBox("CreateFile() fail","Error",0);
  return;
 }
 nRet=ReadFile(hFile,buffer,2,&dwRead,NULL); // Unicode 标志 0xFFFE
 if((!nRet)||2!=dwRead){
  MessageBox("ReadFile() Read first two byte fail","Error",0);
  CloseHandle(hFile);
  return;
 }
 else  MessageBox("ReadFile() Read first two byte OK","debug ",0);

 nRet=ReadFile(hFile,buffer,dwNeedRead,&dwRead,NULL);
 if(!nRet){
  MessageBox("ReadFile() fail","Error",0);
  CloseHandle(hFile);
  return;
 }

 memcpy(wchbuffer,buffer,1024);
 _tsetlocale(LC_ALL,_T(""));//设置代码页
 nRet=wcstombs(chbuffer,wchbuffer,sizeof(wchbuffer));
 if(nRet==1) {
  sprintf(chmsg,"wcstombs changed :%d Error:%d",nRet,GetLastError());
  MessageBox(chmsg,"debug",0);
 }

要读所有内容的话,还需要处理。