xyjzsh

c++中的位运算

先来考考大家：

testBitOperate()
{
   int data =7;
   int mask = 0x8;

   int res = 1<<7;

   printf("res=%d",res);
}
res的结果是多少？答案：请拖到帖子最后

今天学习了一下c++的位运算。
按位逻辑运算符&，|，^,~,>>,<<可以应用于整形和枚举。可以应用于
bool char short int long ，以及它们对应的无符号的类型，以及enum。

在此我要强调一下移位的两个运算符>>,<<的使用。形式如：

结果 = 要移位的数据移位运算符移位的个数；

有6种位运算：
& 与运算
| 或运算
^ 异或运算
~ 非运算(求补)
> > 右移运算
< < 左移运算

res的结果是：128。你打对了吗？
如果答对了你将获得
如果答错了。在此有个不情之请，如果您答错了，能否给我留言，让我们在以后的日子里共同努力！！

posted @ 2010-11-01 10:23 呆人阅读(1935) | 评论 (0) | 编辑收藏

c++构造函数间的调用

#include <stdio.h>

class CTest

{

public:

CTest() {

CTest(0);

//已经调用析构函数

printf("CTest()\r\n");

}

CTest(int i) {

CTest(i, 0);

//已经调用析构函数

printf("CTest(%d)\r\n", i);

}

CTest(int i, int j) {

printf("CTest(%d, %d)\r\n", i, j);

}

virtual ~CTest(){

m_CTestCount++;

printf(" ~CTest() m_CTestCount = %d\r\n", m_CTestCount);

}

static int m_CTestCount;

};

int CTest::m_CTestCount = 0;

int main()

{

CTest cT;

printf("main()\r\n");

//调用析构函数

return 0;

}

调用CTest()时会产生一个临时变量。
如果想在构造函数间调用要用一下形式：

class CTest2

{

public:

CTest2()

{

a=0;

b=0;

}

CTest2(int _a)

{

this->CTest2::CTest2();

a = _a;

printf("in CTest2(int a) and a=%d,b=%d\n",a,b);

}

~CTest2()

{

printf("in destrcutor and c=%d\n",c);

}

int a;

int b;

int static c;

};

注意 this->CTest2::CTest();
建议：
因为构造函数的特别，我们应该尽量避免构造函数间的调用
可以采用狗仔函数默认值的方式
以上为例：
CTest2(int _a=0,int_b=0);
这样就可以省去CTest2()这个默认构造函数。

posted @ 2010-10-29 17:11 呆人阅读(320) | 评论 (0) | 编辑收藏

c++中拷贝子字符串（copy substring!!）

实现功能：
拷贝任意字符串的子字符串.
使用函数：strncpy_s
MSDN解释：
errno_errno_t strncpy_s(
   char *strDest,
   size_t numberOfElements,
   const char *strSource,
   size_t count
);

其中各个变量的含义：
strDest:目标字符串
numberOfElements:目标字符串的大小（以字符为单位）
strSource:源字符串
count:要拷贝的字符串的字符数

Demo：
将morning拷贝到一个新的变量中

char source[100]="good morning everyone and hope you have a good time this winter!!";

char dest[30];

strncpy_s(dest,30,source+5,7);

对于宽字符使用如下：
errno_t wcsncpy_s(
   wchar_t *strDest,
   size_t numberOfElements,
   const wchar_t *strSource,
   size_t count
);

方法二：

void *_memccpy(
   void *dest,
   const void *src,
   int c,
   size_t count
);
解释：
c为最后一个要拷贝的字符

count为dest中可容纳的最大字符数

功能就是将从source开始到c的字符串拷贝到新的变量中。

void test()
{
    char buffer[61];
   char *pdest;
    char string1[60] = "The quicks brown dog jumps over the lazy fox";

   printf( "Function: _memccpy 60 characters or to character 's'\n" );
   printf( "Source: %s\n", string1 );
   pdest = (char*)_memccpy( buffer, string1+4, 's', 60 );
   *pdest = '\0';
   printf( "Result: %s\n", buffer );
   printf( "Length: %d characters\n", strlen( buffer ) );

}

posted @ 2010-10-25 11:23 呆人阅读(3668) | 评论 (0) | 编辑收藏

memcpy，_tcscpy_s的使用

我想完成的任务：
对于一个字符串 LPCTSTR sourceCode
根据某些符合条件的字串subStr拷贝到一个新的字符串中。
使用安全的拷贝函数：_tcscpy_s实际是一个宏，根据是多字节编码或者是Unicode编码而调用不同的函数。
在tchar.h中我们可以找到：
#ifdef _UNICODE
.......
#define _tcscpy_s wcscpy_s
.......
#else
....
#define _tcscpy_s strcpy_s
...
#endif
原型：
_Check_return_wat_ _CRTIMP_ALTERNATIVE errno_t __cdecl wcscpy_s(_Out_z_cap_(_DstSize) wchar_t * _Dst, _In_ rsize_t _DstSize, _In_z_ const wchar_t * _Src);
使用：
wcscpy_s(dest,count,src);
src不得多于count-1个字符；
该函数最多将count-1个字符从src拷贝到dest中,然后在会在dest的字符串后面自动的加上'\0'
其中count是字符数，而不是字节数。

解析memcpy
使用 void* memcpy(void* dest , const void* src, size_t count);
特别注意这里的count指的是字节数。
当source中的字符数<count时memcpy会在将count后面全部清零。
但是允许拷贝count*sizeof(TCHAR)

posted @ 2010-10-22 17:11 呆人阅读(12941) | 评论 (0) | 编辑收藏

c++ 中关于int，unsigned int , short的关系与应用

int类型比较特殊，具体的字节数同机器字长和编译器有关。如果要保证移植性，尽量用__int16 __int32 __int64吧
__int16、__int32这种数据类型在所有平台下都分配相同的字节。所以在移植上不存在问题。
所谓的不可移植是指：在一个平台上编写的代码无法拿到另一个平台上运行时，不能达到期望的运行结果。
例如：在32为平台上（所谓32位平台是指通用寄存器的数据宽度是32）编写代码，int 类型分配4个字节，而在16位平台是则分配2个字节，那么在16位上编译出来的exe，
其中是为int分配2字节，而在32位平台上运行时，会按照4个字节来解析，显然会出错误的！！

而对于非int行，目前为止，所有的类型分配的字节数都是兼容的，即不同平台对于同一个类型分配相同的字节数！！

建议：在代码中尽量避免使用int类型，根据不同的需要可以用short,long,unsigned int 等代替。

下面是各个类型一览表【转】

64位指的是cpu通用寄存器的数据宽度是64位的。

数据类型名称 字节数 别名 取值范围

int * signed,signed int 由操作系统决定，即与操作系统的＂字长＂有关

unsigned int * unsigned 由操作系统决定，即与操作系统的＂字长＂有关

__int8 1 char,signed char –128 到 127

__int16 2 short,short int,signed short int –32,768 到 32,767

__int32 4 signed,signed int –2,147,483,648 到 2,147,483,647

__int64 8 无 –9,223,372,036,854,775,808 到 9,223,372,036,854,775,807

bool 1 无 false 或 true

char 1 signed char –128 到 127

unsigned char 1 无 0 到 255

short 2 short int,signed short int –32,768 到 32,767

unsigned short 2 unsigned short int 0 到 65,535

long 4 long int,signed long int –2,147,483,648 到 2,147,483,647

long long 8 none (but equivalent to __int64) –9,223,372,036,854,775,808 到 9,223,372,036,854,775,807

unsigned long 4 unsigned long int 0 到 4,294,967,295

enum * 无由操作系统决定，即与操作系统的＂字长＂有关

float 4 无 3.4E +/- 38 (7 digits)

double 8 无 1.7E +/- 308 (15 digits)

long double 8 无 1.7E +/- 308 (15 digits)

wchar_t 2 __wchar_t 0 到 65,535

类型标识符	类型说明	长度（字节）	范围	备注
char	字符型	1	-128 ~ 127	-2⁷ ~ (2⁷ -1)
unsigned char	无符字符型	1	0 ~ 255	0 ~ (2⁸ -1)
short int	短整型	2	-32768 ~ 32767	2^-15 ~ (2¹⁵ - 1)
unsigned short int	无符短整型	2	0 ~ 65535	0 ~ (2¹⁶ - 1)
int	整型	4	-2147483648 ~ 2147483647	-2³¹ ~ (2³¹ - 1)
unsigned int	无符整型	4	0 ~ 4294967295	0 ~ (2³²-1)
float	实型（单精度）	4	1.1810^-38 ~ 3.4010³⁸	7位有效位
double	实型（双精度）	8	2.2310^-308~ 1.7910³⁰⁸	15位有效位
long double	实型（长双精度）	10	3.3710^-4932 ~ 1.1810⁴⁹³²	19位有效位

posted @ 2010-10-20 11:31 呆人阅读(22031) | 评论 (1) | 编辑收藏

c++中枚举类型的使用

一个枚举是一个类型，它可以保存一组由用户刻画的值。一旦定义之后，枚举的使用就像一个整数类型。
enum {ASM,AUTO,BREAK};
默认方式，枚举符所赋得值从0开始递增。枚举也可以冲命名。

posted @ 2010-10-19 13:41 呆人阅读(355) | 评论 (0) | 编辑收藏

c++的一些建议及图书推荐【转】

第一篇

一些同学问我，如何学好C++，我没有别的办法给你们，唯一的办法就是读书，读大
量的书，就可以解决。要把C++作为日常语言，而不是一种程序语言，这样就好办了。

有人又要问我，那么我应该读什么书才好？没有时间怎么办？

我只能对你们说，没时间的话，就别学C++了，做你们喜欢做的事。生活中没有
C++，也同样美好。

如果你准备学，一定要学好，那么我开个书单，应该问题不是甚大。

首先肯定要读一读Bjarne Stroustrup的The Design and Evolution of C++，了解
一下这个语言的历史。接下来就可以看别的书了，但要不停地回头看这本书，看到
你不断地学到的新技术是怎么样一点点地被接纳到这个语言中去的。

第一本书因人而异，基础好一些的，可以看Stanley B. Lippman的C++ Primer，这
本书非常地巨大，你打星号的部分可以不要看。基础不太好的，可以看Stanley B.
Lippman的Essential C++，这本书份量要轻得多，不过四个C++的范型都讲了，而
且讲得非常清楚。

第二本应该停止技术层面的东西，静下心来看看Pike和Kernighan的The Practice
of Programming，好好地整理一下，在程序设计中应该有哪些注意的事项。这本
非常薄的booklet，可以说是程序员必读的指南。

第三本书，就应该是Bruce Eckel写的、候捷译的Thinking in C++，这本书每过
半年我就要重读一遍。可以说每一章都是写得发人深省的，这本书让我感觉到了
技术运用的非常高的境界，但是语言非常平实，只要认真地读，即使基础不行，
也一定可以懂。我在教课的时候，就是用这本书（面对的学生是零基础）。

要更上一层的话，就要慢一步，先要把握C++设计习惯的良好。这是Scott
Meyers的Effective C++和More Effective C++带给我们的无尽收益。我More
Effective C++买不起，只好花了10块钱复印装订了一本"线装本"，看起来像葵花
宝典（;-)）。这两本书是真正的经典，作者对C++的纯熟，使得语言的风格读起来
简直是如饴甘甜，就像他站在对面在讲课。我手中有这两本书的原版CD，如果有兴
趣，可以发E-mail到sjtu@263.net或在饮水思源投条儿给gaobo索要，只要您提供
光盘我就给免费烧。如果你已经深刻地理解了Effective C++和More Effective
C++，那你可以发现，你在众人中已经是鸡群之鹤。可以指导项目运作了，可以编
写一切你想做的程序了，可以指出别人看起来不错的代码的大小问题了。如果你能
一眼看出有人的代码是对应于"条款27"或"条款M6"，那你可真是让本人刮目了。

我已经讲了，如果要写程序，EC++和MEC++的境界已经足以使你自如应付，可是如
果你还不满足，想关注一些理论层面的问题，或是想看看实现的代码，你就不应该
错过这几本好极了的书。我是说Herb Sutter的Exceptional C++和More
Exceptional C++，这两本书的难度是非常大的，我对每一条的阅读笔记都是十多
页。特别是泛型程序设计的部分，这两本书旁征博引，极尽深入探讨之能事，每每
看懂一条，都抹汗一次，大感酣畅淋漓；还有侯捷的　STL源码剖析　，以实际的
例子一点点地讲解一个STL是怎么样实现的，我是刚开始读，不发表评论；而
Stanley B. Lippman，Cfront的实现者之一，执笔写出Inside the C++ Object
Model，我只有一个字，就是基本帅呆了。我从中了解了无数的编译器解释源代码
的细节，以及记忆体分配的细节，呵呵，这些都知道了，我还怕什么呢？最近得到
了另一Cfront实现者、C++标准委员会Koenig的　C++沉思录，看起来非常不错，这
里也推荐给大家，但我也没看完，亦无发言权。

最后最后，你们，未来的C++理论家们，可要记住，Bjarne Stroustrup的The C++
Programming Language无论如何也应该读个四五遍！这是一切C++的书本的源泉。
如果还觉得不够，就向C++标准委员会订购一本C++标准。

一切中国大陆作者的书，一概不要看（包括我的）。一切VC++或讲特定的编译器的
书，一概不要看。如果需要补C语言的课，买一本非常小的K&R的The C
Programming Language足矣，其它的书一概不要看。不要先学C，再学C++，而要直
接学C++。你不是先学古文，再学白话的，对不对？所以相信我，直接来更容易。

以上文字，皆为原创，本人愿意为每个字负责。

第二篇

好久未来Ｃ板了，原因这段时间一直在研究两本书，看得自己不敢多说一句话。

１、《Effective STL》
订购：http://www.cnforyou.com/query/bookdetail.asp?viBookCode=8537
作者：Scott Meyers
出版社：中国电力出版社
　　一开始欺负这本书比较薄，想快点看完，但不久就发现自己已经翻不动了。直
到看完最后一个字，才发现一个基本的事实：薄的不是这本书，而是自己的见识。
　　有关STL的书也读了不少，正如读《Effective C++》以前，有关C++的书也读了
不少。Meyers的书总是给人一种脱胎换骨的提升感觉，他总能在大家以为老生常谈
的地方挖出意想不到的新意，并指出一些一般人习以为常的东西其实存在种种危机，
或是在一些看来完全等价的选择中，为特定的场合选择最有效的（Most
Effective）那一种。而且他的切入口总是让人看得懂的（不像Stroustrup的书，
第一句话就要琢磨半天），但是他总是会选择几个拓展点，并把它们分析得淋漓尽
致，这时候就需要一段代码一段代码甚至是语句粒度地阅读了——当然，最后总是
看得懂，这和读者的阅读程度总是正比，这会给人极大的成就感。可以说，在STL
实践的书籍，无书可出其右（当然在STL实作方面，我还是要向大家推荐侯捷的
《STL源码剖析》）。
　　读完这本书后，和Pascal就产生明显的距离感了。这里我仍然要说：请热爱
Delphi！我还是更愿意写“var s:set of char;”而不是
“set <char*, less<char*>, allocator<char*> > s”，;-)。

２、《Modern C++ Design》
订购（中文）：http://www.cnforyou.com/query/bookdetail.asp?viBookCode=8184
订购（影印）：http://www.cnforyou.com/query/bookdetail.asp?viBookCode=8319
作者：Andrei Alexandrescu
译者：侯捷、於春景
出版社：华中科技大学出版社（中文）
　　　　中国电力出版社（影印）
　　读完这本书的第一页，我就知道自己放不下它了，但我也知道，我的苦难经历
又要多上一笔了。用C++实作设计模式，已经是骨灰级的难度，但这本书明显还在讲
一个template的对象模型的问题，这在我读《Inside the C++ Object Model》时是
屡攻不下的难点。不过，出乎意料的是这本书居然使我具有一些概念了，而且动手写
出了一个SmartPointer。
　　这本书我还远不能说我读懂了，但是确乎是读完了。如果你还没有读过对象模型
和设计模式的书，我认为需要读一读。否则，直接看这本书根本就是受罪。最近，有
一些朋友也注意到设计模式的重要性了，可能从明年起我在《电脑报》上要发表一些
文章，届时请朋友们指教吧。

另外就是Effective C++点评继续写，我现在觉得更惶恐，但是信心也更足了。
--
La cinquième planète était très curieuse.
C'était la plus petite de toutes.
Il y avait là juste assez de place pour loger un réverbère et un allumeur de
réverbères. le petit prince ne parvenait pas à s'expliquer à quoi pouvaient
servir, quelque part dans le ciel, sur une planète sans maison, ni population,
un réverbère et un allumeur de réverbères.

posted @ 2010-10-19 09:36 呆人阅读(408) | 评论 (1) | 编辑收藏

1.VC++中的char,wchar_t,TCHAR(转载)

总体简介：
由于字符编码的不同，在C++中有三种对于字符类型：char, wchar_t , TCHAR。其实TCHAR不能算作一种类型，他紧紧是一个宏。我们都知道，宏在预编译的时候会被替换成相应的内容。TCHAR 在使用多字节编码时被定义成char，在Unicode编码时定义成wchar_t。

1.VC++中的char,wchar_t,TCHAR
大家一起做一个项目，经常发现有的人爱用strcpy等标准ANSI函数，有的人爱用_tXXXX函数，这个问题曾经搞的很混乱。为了统一，有必要把来龙去脉搞清楚。

为了搞清这些函数，就必须理请几种字符类型的写法。char就不用说了，先说一些wchar_t。wchar_t是Unicode字符的数据类型，它实际定义在<string.h>里：
typedef unsigned short wchar_t;
不能使用类似 strcpy这样的ANSI C字符串函数来处理wchar_t字符串，必须使用wcs前缀的函数，例如wcscpy。为了让编译器识别Unicode字符串，必须以在前面加一个 “L”,例如:
wchar_t *szTest=L"This is a Unicode string.";

下面在看看TCHAR。如果你希望同时为ANSI和Unicode编译的源代码，那就要include TChar.h。TCHAR是定义在其中的一个宏，它视你是否定义了_UNICODE宏而定义成char或者wchar_t。如果你使用了TCHAR，那么就不应该使用ANSI的strXXX函数或者Unicode的wcsXXX函数了，而必须使用TChar.h中定义的_tcsXXX函数。另外，为了解决刚才提到带“L”的问题，TChar.h中定义了一个宏：“_TEXT”。

以strcpy函数为例子，总结一下:
.如果你想使用ANSI字符串，那么请使用这一套写法：
char szString[100];
strcpy(szString,"test");
.如果你想使用Unicode字符串，那么请使用这一套：
wchar_t szString[100];
wcscpyszString,L"test");
.如果你想通过定义_UNICODE宏，而编译ANSI或者Unicode字符串代码：
TCHAR szString[100];
_tcscpy(szString,_TEXT("test"));

2.字符串及处理之三: 使用TCHAR系列方案
使用TCHAR系列方案编写程序
　　TCHAR是一种字符串类型，它让你在以MBCS和UNNICODE来build程序时可以使用同样的代码，不需要使用繁琐的宏定义来包含你的代码。
      TCHAR的引入，主要是在Tchar.h文件中,该文件包含这方面的重要的定义信息。
      对于包含了对str函数或wcs函数进行显式调用的代码来说，无法非常容易地同时为ANSI和Unicode对这些代码进行编译。本章前面说过，可以创建同时为ANSI和Unicode进行编译的单个源代码文件。若要建立双重功能，必须包含TChar.h文件，而不是包含String.h文件。
      TChar.h文件的唯一作用是帮助创建ANSI/Unicode通用源代码文件。它包含你应该用在源代码中的一组宏，而不应该直接调用str函数或者 wcs函数。如果在编译源代码文件时定义了_UNICODE，这些宏就会引用wcs这组函数。如果没有定义_UNICODE，那么这些宏将引用str这组宏。
      TCHAR的定义如下：
      #ifdef UNICODE
      typedef wchar_t TCHAR;
      #else
      typedef char TCHAR;
      #endif
      所以用MBCS来build时，TCHAR是char，使用UNICODE时，TCHAR是wchar_t。
      还有一个宏来处理定义Unicode字符串常量时所需的L前缀。
      #ifdef UNICODE
      #define _T(x) L##x
      #define _TEXT(x) L##x
      #define __T(x) L##x
      #else
      #define _T(x) x
      #define _TEXT(x) x
      #define __T(x) x
      #endif
     ## 是一个预处理操作符，它可以把两个参数连在一起。如果你的代码中需要字符串常量，在它前面加上_T宏。如果你使用Unicode来build，它会在字符串常量前加上L前缀。
      TCHAR szNewText[] = _T("we love Bob!");
    _UNICODE宏用于C运行期头文件，而UNICODE宏则用于Windows头文件。当编译源代码模块时，通常必须同时定义这两个宏。
　　像是用宏来隐藏SetWindowTextA/W的细节一样，还有很多可以供你使用的宏来实现str***()和_mbs***()等字符串函数。例如，你可以使用_tcsrchr宏来替换strrchr()、_mbsrchr()和wcsrchr()。_tcsrchr根据你预定义的宏是_MBCS还是 UNICODE来扩展成正确的函数，就象SetWindowText所作的一样。
不仅str***()函数有TCHAR宏。其他的函数如， _stprintf（代替sprinft()和swprintf()）,_tfopen（代替fopen()和_wfopen()）。 MSDN中"Generic-Text Routine Mappings."标题下有完整的宏列表。

3.字符串及处理之二: 基本字符串类型及函数
常用的字符串类型有：char * ，wchar_t * ，WCHAR * ， TCHAR *
char *
    最基本的类型，其对应的一组处理函数是以str...开头的标准的ANSI C字符串函数。
wchar_t *
    是这样定义的：typedef unsigned short wchar_t;
    另外，在头文件中有这样的定义：typedef wchar_t WCHAR; 所以WCHAR实际就是wchar_t
    wchar_t * 是16-bit UNICODE character（宽字符）所使用的基本类型。
其对应的一组处理函数是以wcs...开头的标准的字符串函数。

常用的字符串处理函数和宏:
1、str 开头的函数处理SBCS字符串
2、wcs 开头的函数处理宽字符串，wcs是宽字符串的英文缩写
    所有的unicode函数均以wcs开头。若要调用Unicode函数，只需用前缀wcs来取代ANSI字符串函数的前缀str即可。
    对于每一个标准的ANSI C字符串函数，基本都有等价的unicode函数.
3、_mbs 开头的函数处理DBCS字符串
    微软还在它的CRT(C runtime library)中增加了操作DBCS字符串的版本。Str***()函数都有对应名字的DBCS版本_mbs***()。
    如果你料到可能会遇到DBCS字符串（如果你的软件会被安装在使用DBCS编码的国家，如中国，日本等，你就可能会），你应该使用_mbs***()函数，因为他们也可以处理SBCS字符串。（一个DBCS字符串也可能含有单字节字符，这就是为什么_mbs***()函数也能处理SBCS字符串的原因）。微软还提供了几个函数方便对dbcs的处理，见后面的描述。
    如果只是调用strlen函数，那么你无法真正了解字符串中究竟有多少字符，它只能告诉你到达结尾的0之前有多少个字节。ANSI的C运行期库中没有配备相应的函数，使你能够对双字节字符集进行操作。但是，Microsoft Visual C++的运行期库却包含许多函数，如_mbslen ,它可以用来操作多字节（既包括单字节也包括双字节）字符串。
4、_tcs 开头的宏配合TCHAR使用
    根据预定义分别扩展为str wcs _mbs，见后面的描述。
5、l开头的windows自带的宽字符处理函数
6、大小写兼有的 windows自带的宽字符处理函数

5和6见后面的描述
更进一步的字符串以及其指针的类型定义

　由于Win32 API文档的函数列表使用函数的常用名字（例如， "SetWindowText"），所有的字符串都是用TCHAR来定义的。（除了XP中引入的只适用于Unicode的API）。下面列出一些常用的 typedefs，你可以在msdn中看到他们。
type                Meaning in MBCS builds        Meaning in Unicode builds
WCHAR                 wchar_t                             wchar_t
LPSTR                   char*                                char*
LPCSTR                 const char*                        const char*
LPWSTR                wchar_t*                           wchar_t*
LPCWSTR              const wchar_t*                    const wchar_t*
TCHAR                  char                                  wchar_t
LPTSTR                TCHAR*                            TCHAR*
LPCTSTR               const TCHAR*                     const TCHAR*

4.strings(字符串)详解(一)
之所以抛弃char*的字符串而选用C++标准程序库中的string类，是因为他和前者比较起来，不必担心内存是否足够、字符串长度等等，而且作为一个类出现，他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作，== 进行比较，+ 做串联（是不是很简单?）。我们尽可以把它看成是C++的基本数据类型。
    好了，进入正题………
首先，为了在我们的程序中使用 string类型，我们必须包含头文件 <string>。如下：
    #include <string> //注意这里不是string.h string.h是C字符串头文件

1．声明一个C++字符串
声明一个字符串变量很简单：
    string Str;
这样我们就声明了一个字符串变量，但既然是一个类，就有构造函数和析构函数。上面的声明没有传入参数，所以就直接使用了string的默认的构造函数，这个函数所作的就是把Str初始化为一个空字符串。String类的构造函数和析构函数如下：
a)    string s;  //生成一个空字符串s
b)    string s(str) //拷贝构造函数生成str的复制品
c)    string s(str,stridx) //将字符串str内“始于位置stridx”的部分当作字符串的初值
d)    string s(str,stridx,strlen) //将字符串str内“始于stridx且长度顶多strlen”的部分作为字符串的初值
e)    string s(cstr) //将C字符串作为s的初值
f)    string s(chars,chars_len) //将C字符串前chars_len个字符作为字符串s的初值。
g)    string s(num,c) //生成一个字符串，包含num个c字符
h)    string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值
i)    s.~string() //销毁所有字符，释放内存
都很简单，我就不解释了。
2．字符串操作函数
    这里是C++字符串的重点，我先把各种操作函数罗列出来，不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数，再到后面看他的详细解释。
a) =,assign()   //赋以新值
b) swap()   //交换两个字符串的内容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare()  //比较字符串
j) size(),length()  //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty()  //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) >>,getline() //从stream读取某值
q) <<  //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
下面详细介绍：
2．1 C++字符串和C字符串的转换
    C++提供的由C++字符串得到对应的 C_string的方法是使用data()、c_str()和copy()，其中，data()以字符数组的形式返回字符串内容，但并不添加’\0’。 c_str()返回一个以‘\0’结尾的字符数组，而copy()则把字符串的内容复制或写入既有的c_string或字符数组内。C++字符串并不以’ \0’结尾。我的建议是在程序中能使用C++字符串就使用，除非万不得已不选用c_string。由于只是简单介绍，详细介绍掠过，谁想进一步了解使用中的注意事项可以给我留言(到我的收件箱)。我详细解释。
2．2 大小和容量函数
    一个C++字符串存在三种大小：a)现有的字符数，函数是size()和length()，他们等效。Empty()用来检查字符串是否为空。b)max_size() 这个大小是指当前C++字符串最多能包含的字符数，很可能和机器本身的限制或者字符串所在位置连续内存的大小有关系。我们一般情况下不用关心他，应该大小足够我们用的。但是不够用的话，会抛出length_error异常c)capacity()重新分配内存之前 string所能包含的最大字符数。这里另一个需要指出的是reserve()函数，这个函数为string重新分配内存。重新分配的大小由其参数决定，默认参数为0，这时候会对string进行非强制性缩减。

还有必要再重复一下C++字符串和C字符串转换的问题，许多人会遇到这样的问题，自己做的程序要调用别人的函数、类什么的（比如数据库连接函数Connect(char*,char*)），但别人的函数参数用的是char*形式的，而我们知道，c_str()、data()返回的字符数组由该字符串拥有，所以是一种const char*,要想作为上面提及的函数的参数，还必须拷贝到一个char*,而我们的原则是能不使用C字符串就不使用。那么，这时候我们的处理方式是：如果此函数对参数(也就是char*)的内容不修改的话，我们可以这样Connect((char*)UserID.c_str(), (char*)PassWD.c_str()),但是这时候是存在危险的，因为这样转换后的字符串其实是可以修改的（有兴趣地可以自己试一试），所以我强调除非函数调用的时候不对参数进行修改，否则必须拷贝到一个char*上去。当然，更稳妥的办法是无论什么情况都拷贝到一个char*上去。同时我们也祈祷现在仍然使用C字符串进行编程的高手们（说他们是高手一点儿也不为过，也许在我们还穿开裆裤的时候他们就开始编程了，哈哈…）写的函数都比较规范，那样我们就不必进行强制转换了。

2．3元素存取
    我们可以使用下标操作符[]和函数at()对元素包含的字符进行访问。但是应该注意的是操作符[]并不检查索引是否有效（有效索引0~str.length()），如果索引失效，会引起未定义的行为。而at()会检查，如果使用 at()的时候索引无效，会抛出out_of_range异常。
    有一个例外不得不说，const string a;的操作符[]对索引值是a.length()仍然有效，其返回值是’\0’。其他的各种情况，a.length()索引都是无效的。举例如下：
const string Cstr(“const string”);
string Str(“string”);

Str[3];    //ok
Str.at(3);  //ok

Str[100]; //未定义的行为
Str.at(100);  //throw out_of_range

Str[Str.length()]  // 未定义行为
Cstr[Cstr.length()] //返回 ‘\0’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) ////throw out_of_range

我不赞成类似于下面的引用或指针赋值：
char& r=s[2];
char* p= &s[3];
因为一旦发生重新分配，r,p立即失效。避免的方法就是不使用。

2．4比较函数
    C++字符串支持常见的比较操作符（>,>=,<,<=,==,!=），甚至支持string与C-string的比较(如 str<”hello”)。在使用>,>=,<,<=这些操作符的时候是根据“当前字符特性”将字符按字典顺序进行逐一得比较。字典排序靠前的字符小，比较的顺序是从前向后比较，遇到不相等的字符就按这个位置上的两个字符的比较结果确定两个字符串的大小。同时，string(“aaaa”) <string(aaaaa)。
    另一个功能强大的比较函数是成员函数compare()。他支持多参数处理，支持用索引值和长度定位子串来进行比较。他返回一个整数来表示比较结果，返回值意义如下：0-相等〉0-大于 <0-小于。举例如下：
    string s(“abcd”);

    s.compare(“abcd”); //返回0
    s.compare(“dcba”); //返回一个小于0的值
    s.compare(“ab”); //返回大于0的值

s.compare(s); //相等
    s.compare(0,2,s,2,2); //用”ab”和”cd”进行比较小于零
    s.compare(1,2,”bcx”,2); //用”bc”和”bc”比较。
怎么样？功能够全的吧！什么？还不能满足你的胃口？好吧，那等着，后面有更个性化的比较算法。先给个提示，使用的是STL的比较算法。什么？对STL一窍不通？靠，你重修吧！

2．5 更改内容
这在字符串的操作中占了很大一部分。
首先讲赋值，第一个赋值方法当然是使用操作符=，新值可以是string(如：s=ns) 、c_string(如：s=”gaint”)甚至单一字符（如：s=’j’）。还可以使用成员函数assign()，这个成员函数可以使你更灵活的对字符串赋值。还是举例说明吧：
s.assign(str); //不说
s.assign(str,1,3);//如果str 是”iamangel” 就是把”ama”赋给字符串
s.assign(str,2,string::npos);//把字符串str从索引值2 开始到结尾赋给s
s.assign(“gaint”); //不说
s.assign(“nico”,5);//把’n’ ‘I’ ‘c’ ‘o’ ‘\0’赋给字符串
s.assign(5,’x’);//把五个x赋给字符串
把字符串清空的方法有三个：s=””; s.clear();s.erase();(我越来越觉得举例比说话让别人容易懂！)。
string提供了很多函数用于插入（insert）、删除（erase）、替换（replace）、增加字符。
先说增加字符（这里说的增加是在尾巴上），函数有 +=、append()、push_back()。举例如下：
s+=str;//加个字符串
s+=”my name is jiayp”;//加个C字符串
s+=’a’;//加个字符

s.append(str);
s.append(str,1,3);// 不解释了同前面的函数参数assign的解释
s.append(str,2,string::npos)//不解释了

s.append(“my name is jiayp”);
s.append(“nico”,5);
s.append(5,’x’);

s.push_back(‘a’);// 这个函数只能增加单个字符对STL熟悉的理解起来很简单

也许你需要在string中间的某个位置插入字符串，这时候你可以用 insert()函数，这个函数需要你指定一个安插位置的索引，被插入的字符串将放在这个索引的后面。
    s.insert(0,”my name”);
    s.insert(1,str);
这种形式的insert()函数不支持传入单个字符，这时的单个字符必须写成字符串形式(让人恶心)。既然你觉得恶心，那就不得不继续读下面一段话：为了插入单个字符，insert()函数提供了两个对插入单个字符操作的重载函数：insert(size_type index,size_type num,chart c)和insert(iterator pos,size_type num,chart c)。其中size_type是无符号整数，iterator是char*,所以，你这么调用insert函数是不行的：insert(0,1,’j’);这时候第一个参数将转换成哪一个呢？所以你必须这么写：insert((string::size_type)0,1,’j’)！第二种形式指出了使用迭代器安插字符的形式，在后面会提及。顺便提一下，string有很多操作是使用STL的迭代器的，他也尽量做得和STL靠近。
删除函数erase()的形式也有好几种（真烦！），替换函数 replace()也有好几个。举例吧：
string s=”il8n”;
s.replace(1,2,”nternationalizatio”);// 从索引1开始的2个替换成后面的C_string
s.erase(13);//从索引13开始往后全删除
s.erase(7,5);// 从索引7开始往后删5个

2．6提取子串和字符串连接

题取子串的函数是：substr(),形式如下：
s.substr();// 返回s的全部内容
s.substr(11);//从索引11往后的子串
s.substr(5,6);//从索引5开始6个字符
把两个字符串结合起来的函数是+。（谁不明白请致电120）

2．7输入输出操作
1．>> 从输入流读取一个string。
2．<< 把一个string写入输出流。
另一个函数就是getline(),他从输入流读取一行内容，直到遇到分行符或到了文件尾。

2．8搜索与查找
查找函数很多，功能也很强大，包括了：
    find()
    rfind()
    find_first_of()
    find_last_of()
    find_first_not_of()
    find_last_not_of()
这些函数返回符合搜索条件的字符区间内的第一个字符的索引，没找到目标就返回npos。所有的函数的参数说明如下：
第一个参数是被搜寻的对象。第二个参数（可有可无）指出string内的搜寻起点索引，第三个参数（可有可无）指出搜寻的字符个数。比较简单，不多说不理解的可以向我提出，我再仔细的解答。当然，更加强大的STL搜寻在后面会有提及。
最后再说说npos的含义，string::npos的类型是string::size_type,所以，一旦需要把一个索引与npos相比，这个索引值必须是string::size)type类型的，更多的情况下，我们可以直接把函数和npos进行比较（如：if(s.find(“jia”)==string::npos)）。
    第二部分是关于 C++字符串对迭代器的支持的，视大家的需要我将写出来（意思就是不需要就算了，我乐得轻省，哈哈…）。
好了，大概的对string类型进行了阐述，希望起到抛砖引玉的作用，让初学者对string有个了解而不必已开始就面对复杂的内部结构和无数个注意事项。对字符串更详细地讲解有很多参考书，其实我的内容也是从C++标准程序库得来的，加上几句自己的看法，所以要感谢这本书的作者和译者。任何人对本文进行引用都要标明作者是Nicolai M.Josuttis 译者是侯捷/孟岩。不过不要提及我，任何观点的错误都与我无关（除了这里边体现我主观想法的几句话，也就那几句话）。

posted @ 2010-10-15 16:30 呆人阅读(8553) | 评论 (0) | 编辑收藏

编译项目跟踪文档(1)

最近要做一个简易的编译器，第一个版本几乎是裸写出来的，到了后期连我自己都不知道如何收场，这让我很是恼火。第一个版本带给我主要是教训，但也有小小的成果。为了让自己又更清晰地思路，在第二个版本开始之际，我将把主要思想和代码记录下来和大家分享。希望大家能提出宝贵的意见。

posted @ 2010-10-14 13:44 呆人阅读(177) | 评论 (0) | 编辑收藏

仅列出标题

c++中的位运算

c++构造函数间的调用

c++中拷贝子字符串（copy substring!!）

memcpy，_tcscpy_s的使用

c++ 中关于int，unsigned int , short的关系与应用

c++中枚举类型的使用

c++的一些建议及图书推荐【转】

1.VC++中的char,wchar_t,TCHAR(转载)

编译项目跟踪文档(1)

导航

统计

常用链接

留言簿(1)

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜

数据类型名称	字节数	别名	取值范围
int	*	signed,signed int	由操作系统决定，即与操作系统的＂字长＂有关
unsigned int	*	unsigned	由操作系统决定，即与操作系统的＂字长＂有关
__int8	1	char,signed char	–128 到 127
__int16	2	short,short int,signed short int	–32,768 到 32,767
__int32	4	signed,signed int	–2,147,483,648 到 2,147,483,647
__int64	8	无	–9,223,372,036,854,775,808 到 9,223,372,036,854,775,807
bool	1	无	false 或 true
char	1	signed char	–128 到 127
unsigned char	1	无	0 到 255
short	2	short int,signed short int	–32,768 到 32,767
unsigned short	2	unsigned short int	0 到 65,535
long	4	long int,signed long int	–2,147,483,648 到 2,147,483,647
long long	8	none (but equivalent to __int64)	–9,223,372,036,854,775,808 到 9,223,372,036,854,775,807
unsigned long	4	unsigned long int	0 到 4,294,967,295
enum	*	无	由操作系统决定，即与操作系统的＂字长＂有关
float	4	无	3.4E +/- 38 (7 digits)
double	8	无	1.7E +/- 308 (15 digits)
long double	8	无	1.7E +/- 308 (15 digits)
wchar_t	2	__wchar_t	0 到 65,535