C底世界

C 学习库

  C++博客 :: 首页 :: 联系 :: 聚合  :: 管理
  3 Posts :: 1 Stories :: 0 Comments :: 0 Trackbacks

常用链接

留言簿(12)

我参与的团队

搜索

  •  

最新评论

阅读排行榜

评论排行榜

2008年7月10日 #

目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式。因为1位二进制数可以表示(21=)2种状态:0、1;而2位二进制数可以表示(22)=4种状态:00、01、10、11;依次类推,7位二进制数可以表示(27=)128种状态,每种状态都唯一地编为一个7位的二进制码,对应一个字符(或控制码),这些码可以排列成一个十进制序号0~127。所以,7 位ASCII码是用七位二进制数进行编码的,可以表示128个字符。

 

  第0~32号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

  第33~126号(共94个)是字符,其中第48~57号为0~9十个阿拉伯数字;65~90号为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

  注意:在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

  为了便于查询,以下列出ASCII码表:

  第128~255号为扩展字符(不常用)

Dec Hx Oct Char Dec Hx Oct Char Dec Hx Oct Char Dec Hx Oct Char
0 0 000 NUL (null) 32 20 040 SPACE 64 40 100 @ 96 60 140 `
1 1 001 SOH (start of heading) 33 21 041 ! 65 41 101 A 97 61 141 a
2 2 002 STX (start of text) 34 22 042 " 66 42 102 B 98 62 142 b
3 3 003 ETX (end of text) 35 23 043 # 67 43 103 C 99 63 143 c
4 4 004 EOT (end of transmission) 36 24 044 $ 68 44 104 D 100 64 144 d
5 5 005 ENQ (enquiry) 37 25 045 % 69 45 105 E 101 65 145 e
6 6 006 ACK (acknowledge) 38 26 046 & 70 46 106 F 102 66 146 f
7 7 007 BEL (bell) 39 27 047 ' 71 47 107 G 103 67 147 g
8 8 010 BS (backspace) 40 28 050 ( 72 48 110 H 104 68 150 h
9 9 011 TAB (horizontal tab) 41 29 051 ) 73 49 111 I 105 69 151 i
10 A 012 LF (NL line feed, new_line) 42 2A 052 * 74 4A 112 J 106 6A 152 j
11 B 013 VT (vertical tab) 43 2B 053 + 75 4B 113 K 107 6B 153 k
12 C 014 FF (NP form feed, new page) 44 2C 054 , 76 4C 114 L 108 6C 154 l
13 D 015 CR (carriage return) 45 2D 055 - 77 4D 115 M 109 6D 155 m
14 E 016 SO (shift out) 46 2E 056 . 78 4E 116 N 110 6E 156 n
15 F 017 SI (shift in) 47 2F 057 / 79 4F 117 O 111 6F 157 o
16 10 020 DLE (data link escape) 48 30 060 0 80 50 120 P 112 70 160 p
17 11 021 DC1 (device control 1) 49 31 061 1 81 51 121 Q 113 71 161 q
18 12 022 DC2 (device control 2) 50 32 062 2 82 52 122 R 114 72 162 r
19 13 023 DC3 (device control 3) 51 33 063 3 83 53 123 S 115 73 163 s
20 14 024 DC4 (device control 4) 52 34 064 4 84 54 124 T 116 74 164 t
21 15 025 NAK (negative acknowledge) 53 35 065 5 85 55 125 U 117 75 165 u
22 16 026 SYN (synchronous idle) 54 36 066 6 86 56 126 V 118 76 166 v
23 17 027 ETB (end of trans. block) 55 37 067 7 87 57 127 W 119 77 167 w
24 18 030 CAN (cancel) 56 38 070 8 88 58 130 X 120 78 170 x
25 19 031 EM (end of medium) 57 39 071 9 89 59 131 Y 121 79 171 y
26 1A 032 SUB (substitute) 58 3A 072 : 90 5A 132 Z 122 7A 172 z
27 1B 033 ESC (escape) 59 3B 073 ; 91 5B 133 [ 123 7B 173 {
28 1C 034 FS (file separator) 60 3C 074 < 92 5C 134 \ 124 7C 174
29 1D 035 GS (group separator) 61 3D 075 = 93 5D 135 ] 125 7D 175 }
30 1E 036 RS (record separator) 62 3E 076 > 94 5E 136 ^ 126 7E 176 ~
31 1F 037 US (unit separator) 63 3F 077 ? 95 5F 137 _ 127 7F 177 DEL

扩充字符集(Extended Character Set)

image:查ASC码-ascii.gif

ISO Latin-1字符集(编码160-255)

编码 字符 编码 字符 编码 字符 编码 字符
160 172 ¬ 184 ¸ 196 Ä
161 ¡ 173 185 ¹ 197 Å
162 ¢ 174 ® 186 º 198 Æ
163 £ 175 ÷ 187 » 199 Ç
164 ¤ 176 188 ¼ 200 È
165 ¥ 177 ± 189 ½ 201 É
166 ¦ 178 ² 190 ¾ 202 Ê
167 179 ³ 191 ¿ 203 Ë
168 ¨ 180 ´ 192 À 204 Ì
169 © 181 µ 193 Á 205 Í
170 ª 182 194 Â 206 Î
171 « 183 · 195 Ã 207 Ï
编码 字符 编码 字符 编码 字符 编码 字符
208 Ð 220 Ü 232 è 244 ô
209 Ñ 221 Ý 233 é 245 õ
210 Ò 222 Þ 234 ê 246 ö
211 Ó 223 ß 235 ë 247 ÷
212 Ô 224 à 236 ì 248 ø
213 Õ 225 á 237 í 249 ù
214 Ö 226 â 238 î 250 ú
215 227 ã 239 ï 251 û
216 Ø 228 ä 240 ð 252 ü
217 Ù 229 å 241 ñ 253 ý
218 Ú 230 æ 242 ò 254 þ
219 Û 231 ç 243 ó 255 ÿ
posted @ 2008-07-10 16:28 C_Student 阅读(568) | 评论 (0)编辑 收藏

1 基本解释

  extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中,提示编译器遇到此变量和函数时在其他模块中寻找其定义。

  另外,extern也可用来进行链接指定。

2 问题:extern 变量

  在一个源文件里定义了一个数组:char a[6];
  在另外一个文件里用下列语句进行了声明:extern char *a;
  请问,这样可以吗?


  答案与分析:
  1)、不可以,程序运行时会告诉你非法访问。原因在于,指向类型T的指针并不等价于类型T的数组。extern char *a声明的是一个指针变量而不是字符数组,因此与实际的定义不同,从而造成运行时非法访问。应该将声明改为extern char a[ ]。

  2)、例子分析如下,如果a[] = "abcd",则外部变量a=0x61626364 (abcd的ASCII码值),*a显然没有意义

  显然a指向的空间(0x61626364)没有意义,易出现非法内存访问。

  3)、这提示我们,在使用extern时候要严格对应声明时的格式,在实际编程中,这样的错误屡见不鲜。

  4)、extern用在变量声明中常常有这样一个作用,你在*.c文件中声明了一个全局的变量,这个全局的变量如果要被引用,就放在*.h中并用extern来声明。

4 问题:extern 函数2

  当函数提供方单方面修改函数原型时,如果使用方不知情继续沿用原来的extern申明,这样编译时编译器不会报错。但是在运行过程中,因为少了或者多了输入参数,往往会照成系统错误,这种情况应该如何解决?

  答案与分析:

  目前业界针对这种情况的处理没有一个很完美的方案,通常的做法是提供方在自己的xxx_pub.h中提供对外部接口的声明,然后调用方include该头文件,从而省去extern这一步。以避免这种错误。

  宝剑有双锋,对extern的应用,不同的场合应该选择不同的做法。

5 问题:extern “C”

  在C++环境下使用C函数的时候,常常会出现编译器无法找到obj模块中的C函数定义,从而导致链接失败的情况,应该如何解决这种情况呢?

  答案与分析:

  C++语言在编译的时候为了解决函数的多态问题,会将函数名和参数联合起来生成一个中间的函数名称,而C语言则不会,因此会造成链接时找不到对应函数的情况,此时C函数就需要用extern “C”进行链接指定,这告诉编译器,请保持我的名称,不要给我生成用于链接的中间函数名。

  下面是一个标准的写法:

//在.h文件的头上
#ifdef __cplusplus
#if __cplusplus
extern "C"{
 #endif
 #endif /* __cplusplus */
 …
 …
 //.h文件结束的地方
 #ifdef __cplusplus
 #if __cplusplus
}
#endif
#endif /* __cplusplus */
 

3 问题:extern 函数1

  常常见extern放在函数的前面成为函数声明的一部分,那么,C语言的关键字extern在函数的声明中起什么作用?

  答案与分析:

  如果函数的声明中带有关键字extern,仅仅是暗示这个函数可能在别的源文件里定义,没有其它作用。即下述两个函数声明没有明显的区别:

extern int f(); 和int f();
  当然,这样的用处还是有的,就是在程序中取代include “*.h”来声明函数,在一些复杂的项目中,我比较习惯在所有的函数声明前添加extern修饰。
posted @ 2008-07-10 11:34 C_Student 阅读(4220) | 评论 (0)编辑 收藏

extern "C"{}的作用就是说明这在{}范围之内说明的函数是按c,或者需要按c标准来编译。可以从声明调用二个方面来描述它的作用:
1.声明
  以下c++代码:
  extern "C" { void test() }
  void test()
  {
    // do test
  }
表示希望编译器使用c标准来编译test函数。而在c语言中不支持extern "C"。
2.c++代码调用c代码
  extern "C" { void test() //test()是c代码或者或者说明是按c标准编译的代码 }
  int main()
  {
     test();
  }
 无论test函数是c写的还是c++写的,只要它是按c标准编译的,就需要加上extern "C" 声明
3.c调用c++代码
  c要调用c++代码,在c++代码中必须以extern "C" 来声明函数,如上文1所示。以下是c代码
  void test();
  int main()
  {
     test();
  }

例如:
#ifdef   __cplusplus     /*   __cplusplus  表示是C++程序 */ 
  extern   "C"   {       //这是什么意思   ?????????????  
  #endif   /*   __cplusplus   */

表示如果现在的编译环境是C++的话,让编译器生成C样式的函数名,也就是阻止编译器使用C++的方法进行函数名解析。

C++中因为函数可以重载:  
  int   a(char)  
  int   a(int)  
  int   a(double)...  
  所以,在编译后的代码里,三个a()是不同的函数名如a_char_xxx,a_in_xxx,a_double_xxx等等.

要去掉后面的一大串符号只要在a()前面加上exter   "C"即可

在DLL的对外接口函数中,必须用exter   "C"   限制,否则,外部调用者根本不知道你的真正函数名.

1   VC6.0编译器可以按C++或C生成目标函数.   两者生成的目标符号表  
      并不一样.   C方式是与原来标准C相兼容.   
2   在DLL中的接口函数一般应按C方式编译而成.   extern   "C"   就是强  
      制指定.   如果不按这种方式指定.GetProcAddress(...)取出来的   
      就不对.   只能隐式连接.

  extern   "c"   的作用就是使得函数的定义名称和导出名称一致

posted @ 2008-07-10 09:07 C_Student 阅读(507) | 评论 (0)编辑 收藏