posts - 17,  comments - 2,  trackbacks - 0
 
     摘要:   阅读全文
posted @ 2008-11-02 20:44 BeyondCN 阅读(188) | 评论 (0)编辑 收藏
     摘要: 转换指南: 将程序从托管扩展 C++ 迁移到 C++/CLI发布日期 : 5/31/2005 | 更新日期 : 5/31/2005Stanley B. Lippman Microsoft Corporation适用于:C++/CLI 第二版ISO-C++摘要 :C++/CLI代表 ISO-C++标准语言的一个动态编程范型扩展。本文列举了 V1 版本语言的功能...  阅读全文
posted @ 2008-10-30 17:08 BeyondCN 阅读(1295) | 评论 (0)编辑 收藏
     摘要: 利用C#制作一个仿IE地址栏的文本框利用IE上网时,只要在地址栏中输入几个字母,与这几个字母模糊匹配的地址就会自动显示出来供用户选择(如下图),用户通过按键盘上的上、下箭头在已有选项中遍历,找到自己需要的选项后,按回车键进行选择,也可以直接用鼠标进行操作,非常方便,我们在程序中也可以利用这一功能,实现自动提示,方便用户输入,下面就以一个实际例子介绍我在工作中是如何实现的。从上图中可以看出,最佳的办...  阅读全文
posted @ 2008-10-30 14:41 BeyondCN 阅读(534) | 评论 (0)编辑 收藏
2000年6月,Microsoft推出了“Microsoft.NET下一代互联网软件和服务战略”,引起IT行业的广泛关注。2000年9月,Microsoft在旧金山发布了Enterprise 2000。同月,Microsoft原总裁兼首席执行官鲍尔默来到中国就“下一代互联网”的主题进行演讲,在中国掀起了一股“.NET旋风”。2000年11月,Microsoft在Comdex计算机大展上发布了Visual Studio.NET软件,并展示了其.NET发展战略的框架体系和开发工具的相关特性,全面加速了Microsoft以.NET技术进军市场的步伐。 

  Microsoft的.NET战略意味着:Microsoft以及在Microsoft平台上的开发者将会制造服务,而不是制造软件。在未来几年之内,Microsoft将陆续发布有关.NET的平台和工具,用于在因特网上开发Web服务。那时,工作在.NET上的用户、开发人员和IT工作人员都不再购买软件、安装软件和维护软件。取而代之的是,他们将定制服务,软件会自动安装,所有的维护和升级也会通过互联网进行。“Microsoft.NET 代表了一个集合、一个环境、一个可以作为平台支持下一代Internet的可编程结构。”这就是鲍尔默对.NET的描述。


  作为.NET的最新特性组成部分,Microsoft .NET Framework是一个用于构建,部署和运行Web服务及应用程序的平台。它为将现有投资与下一代应用程序和服务的集成提供了高产的,基于标准的,多语言环境,同时它还用于解决Internet级应用程序的部署和操作问题。.NET框架包含三个主要部分:通用语言运行时,一组层次化的统一的类库,及组件化版本的动态服务器主页(称为ASP.NET)。

  用于开发.NET Framework的语言有Visual C#、VB.NET和C++托管扩展(Managed Extensions for C++)。其中C#是开发.NET的元语言,而C++托管扩展是在C++基础上建立起来的,用来为Visual C++程序员开发.NET框架应用程序而设计。为叙述方便,我们将C++托管扩展就称之为“托管C++”。
为了帮助C/C++以及Visual C++程序员或爱好者快速使用托管C++开发.NET Framework程序,我们将陆续推出相关的一系列文章。

  本篇“托管C++概述”主要讲述了什么是托管C++、开发.NET Framework(框架)的项目类型以及与标准C++之间的区别。

  1、什么是托管C++?

  在回答这个问题,首先要搞清楚什么是“托管”(Managed)。托管是.NET的一个专门概念,它是融于通用语言运行时(CLR)中的一种新的编程理念,因此我们完全可以把“托管”视为“.NET”。那么什么是“通用语言运行时”?通用语言运行时是.NET 框架应用程序的执行引挚。它提供了许多服务,其中包括:代码管理(装入和执行)、类型安全性验证、元数据(高级类型信息)访问、为管理对象管理内存、管理代码,COM对象和预生成的DLLs(非管理代码和数据)的交互操作性、对开发人员服务的支持等等。

  也就是说,使用托管C++意味着,我们的代码可以被CLR所管理,并能开发出具有最新特性如垃圾自动收集、程序间相互访问等的.NET框架应用程序。

  由托管概念所引发的C++应用程序包括托管代码、托管数据和托管类三个组成部分。  

  (1) 托管代码:.Net环境提供了许多核心的运行(RUNTIME)服务,比如异常处理和安全策略。为了能使用这些服务,必须要给运行环境提供一些信息代码(元数据),这种代码就是托管代码。所有的C#、VB.NET、JScript.NET默认时都是托管的,但Visual C++默认时不是托管的,必须在编译器中使用命令行选项(/CLR)才能产生托管代码。

  (2) 托管数据:与托管代码密切相关的是托管数据。托管数据是由公共语言运行的垃圾回收器进行分配和释放的数据。默认情况下,C#、Visual Basic 和 JScript.NET 数据是托管数据。不过,通过使用特殊的关键字,C# 数据可以被标记为非托管数据。Visual C++数据在默认情况下是非托管数据,即使在使用 /CLR 开关时也不是托管的。

  (3) 托管类:尽管Visual C++数据在默认情况下是非托管数据,但是在使用C++的托管扩展时,可以使用“__gc”关键字将类标记为托管类。就像该名称所显示的那样,它表示类实例的内存由垃圾回收器管理。另外,一个托管类也完全可以成为 .NET 框架的成员,由此可以带来的好处是,它可以与其他语言编写的类正确地进行相互操作,如托管的C++类可以从Visual Basic类继承等。但同时也有一些限制,如托管类只能从一个基类继承等。需要说明的是,在托管C++应用程序中既可使用托管类也可以使用非托管类。这里的非托管类不是指标准C++类,而是使用托管C++语言中的__nogc关键字的类。

2、用托管C++可以开发.NET框架的项目类型

  使用托管C++应该是C++程序员编写.NET框架应用程序最好的一种选择,通过集成在Visual Studio.NET开发环境的托管C++向导,我们可以创建以下几种开发.NET框架的项目类型:

  (1) 托管C++应用程序:用来创建一个支持托管扩展的单独C++应用程序,使用它还可创建任何类型的应用程序,包括.NET框架客户应用程序。

  (2) 托管C++类库:用来创建一个支持托管扩展的C++DLL,使用它可以生成一个能被.NET框架应用程序调用的托管类型的组件。

  (3) 托管C++空项目:用来创建一个空的托管项目,该项目只含有支持托管扩展的正确编译和链接的开关选项。使用它能将一个已有的C++源文件进入到一个托管环境中。

  (4) 托管C++ Web服务:用于创建两个项目,一个是C++托管扩展项目,另一个是部署项目。

  3、托管C++与标准C++的主要区别

  尽管托管C++是从标准C++建立而来的,但它与标准C++有着本质上的区别,这主要体现在以下几个方面:

  (1) 广泛采用“名称空间”(namespace)

  名称空间是类型的一种逻辑命名方案,.NET使用该命名方案用于将类型按相关功能的逻辑类别进行分组,利用名称空间可以使开发人员更容易在代码中浏览和引用类型。当然,我们也可将名称空间理解成是一个“类库名”。 

  尽管很早Microsoft就在Visual C++中支持名称空间的编程方式,但是很少引起Visual C++程序员的普遍关注。现在在托管C++程序中,我们必须使用这一方式,即使用#using和using关键字。例如下面的简单程序代码是在控制台上输出“Hello World”:

#using 
using namespace System;
int main(void)
{
Console::WriteLine(S"Hello World");
return 0;
}

  代码中,#using是用来将一个元数据文件输入到托管C++程序中,这些文件可以是包含托管数据和结构的MSIL (Microsoft intermediate language,微软中间语言)文件,如DLL、EXE、OBJ文件等。mscorlib.dll是.NET框架的一个核心类库,包含主要的名称空间System。程序的第二行代码“using namespace System;”用来使用System名称空间。System是.NET框架根名称空间,包含最基本的类型,如用于数据流的输入/输出的System::IO等。

  在对托管C++程序开发的不断深入,我们不久就会发现,许多类型的引用都要在程序的前面使用#using和using来进行。

  (2) 基本数据类型的变化

  我们知道,标准C++语言的数据类型是非常丰富的。而托管C++的数据类型更加丰富,不仅包含了标准C++中的数据类型,而且新增了__int64(64位整型)、Decimal(96位十进制数)、String*(字符串类型)和Object*(对象类型)等类型,表1-1列出它们各自数据类型。

类型描述标准C++类型名托管C++类型名长度(位)
布尔型boolbool8
字符型charsigned char8
无符号字符型unsigned charchar8
短整型short [int]short16
无符号短整型unsigned short [int]unsigned short16
整型intint 或 long32
无符号整型unsigned [int]unsigned int 或 long32
长整型long [int]long32
无符号长整型unsigned long [int]unsigned long32
单精度浮点型floatfloat32
双精度浮点型doubledouble64
长双精度浮点型long double--64
Unicode字符--wchar_t16
64位整型--__int6464
无符号64位整型--unsigned __int6464
96位十进制值--Decimal96
对象类型--Object*32
字符串类型--String*--


  需要注意的是,String和Object在定义一个变量时,注意要有星号(“*”),但这个变量不是指针变量,这与标准C++的含义是不一样的。例如上面的代码可以改为:

#using 
using namespace System;
int main(void)
{
String* hello = S"Hello World";
Console::WriteLine(hello);
return 0;
}
 (3) 新增三个托管C++类型:__gc class、__value class和__gc interface

  一个__gc类或结构意味着该类或结构的生命周期是由.NET开发平台自动管理及垃圾自动收集,用户不必自已去调用delete来删除。定义一个__gc类或结构和标准C++基本相似,所不同的是在class或struct前加上__gc,例如下面的代码:

__gc class G {
public:
int k;
int sum(int);
};

G::sum(int i) {return i*(i + 1)/2;}
int main()
{
G * g = new G;
Console::WriteLine(g->sum(4)); // 结果输出10
return 0;
}

  但要注意:

  A. 一个__gc类不能从一个非托管类中继承,且不能包含从它派生的非托管类。但一个__gc类最多可以从一个托管类中继承。

  B. 一个__gc类不能定义成一个友元类或包含一个友元成员函数。所谓友元函数,是用来让外部函数访问类中的私有和保护类型成员。

  C. 一个__gc类不能声明或定义以及重载new或delete操作以及不能包含using等声明。

  __value类是用来使用具有短生命期的小型数据项,它不同于__gc类。__gc类数据分配在CLR堆中,而__value类对象是在运行栈或称为NDP(.NET Developer Platform,.NET开发者平台)堆中创建的,从而避免了垃圾回收器不断分配和释放空间而带来的开销。一个__value类可以声明成为一个局部变量、参数和返回值,也可嵌入到一个__gc类中或是作为一个静态变量或在C++堆中分配的变量。例如下面的代码:

#using 
using namespace System;
__value struct V { int i; };
__gc struct G { V v; }; // 嵌入到__gc类中
V f(V v) { // 定义一个全局函数,其值存储在运行栈中
v.i += 1; // 不影响原来形参v的值
return v; // 返回V结构类型的值
}
int main(void) 
{
V v1 = {10}; // 在运行栈中声明并初始化
V v2 = f(v1); // 调用f函数,此时v1中的i为10,而v2中的i为11
G *pG = new G; // 为G实例分配堆空间
pG->v = v1; // pG的v中的i为10
pG->v.i += v2.i; // pG的v中的i为10+11=21
Console::WriteLine(v1.i); // 输出结果为10
Console::WriteLine(v2.i); // 输出结果为11
Console::WriteLine(pG->v.i); // 输出结果为21
return 0;
}

  除此之外,所有的__gc对象都是从类System::Object派生而来,因而能够很容易使用作用在__gc类中的集合和映射功能。然而__value类型并没有与这个基类所共享,因而不能直接将__value作为函数中的Object*实参。为了解决这个问题,.NET允许我们使用__box关键字将一个__value类型视为一个__gc对象。此时__value类型被封装成一个__gc类桩子(Stub),并被复制到NDP堆中。由于在托管C++中,box不具备隐式转换的功能,因此在转换时必须指明转换的类型。

  托管C++中的__gc接口最能体现COM接口的思想,它的定义和声明是非常简单的,它除了关键字不同外,与一个__gc类的声明极为相似。例如下面的代码定义了一个接口IMyBase,其中包含了一个f的方法:

__gc __interface Ibase {
void f();
};

  需要说明的是,接口中所有的方法默认时都是纯虚的且都是公有的,我们不需要在方法之前使用virtual关键字或在方法之后加上“= 0”。其次,在一个__gc接口中不能包含数据成员以及静态成员,也不能包含任何类的声明。下面举一个示例来说明__gc接口的使用:

#using 
using namespace System;

__gc __interface Ibase1 {
int f(int);
};
__gc __interface Ibase2 {
int f(int);
};
__gc struct C: Ibase1, Ibase2 {
int f(int i) { // 接口方法的实现
return 2*i-1;
};
};

int main(void){
C* c = new C;
Console::WriteLine((c -> f(1)).ToString()); // 输出结果为1
Console::WriteLine((__try_cast (c)->f(2)).ToString()); 
// 输出结果为3

Console::WriteLine((__try_cast (c)->f(3)).ToString());
// 输出结果为5

return 0;
}

  代码中,__try_cast用来将某个对象转换成一个指定类型,并当类型转换失败时自动处理由此产生的异常。ToString用来将对象描述成一个字符串。
(4) 简化属性操作

  在__gc类中可以使用.NET的属性,这个属性简化了属性函数的调用操作,这与标准C++中的属性不一样。在标准C++中分别通过get_和put_成员函数来设置或获取相关属性的值。现在,托管C++中的属性操作就好比是对一个属性变量进行操作,例如下列代码:

#using 
using namespace System;

__gc class G {
public:
__property int get_Size() {
Console::WriteLine(S"get_属性");
return nSize;
};
__property void set_Size(int i) { 
Console::WriteLine(S"set_属性");
nSize = i;
};
private:
int nSize;
};

int main() {
G * pG = new G;
pG->Size = 10; // 调用set_Size
int i = pG->Size; // 调用get_Size
Console::WriteLine(i);
}

  程序结果为:

   set_属性

   get_属性

   10

  需要说明的是,托管C++使用__property关键字来定义一个属性的成员函数。从代码中可以看出设置和获取属性的成员函数名称中分别使用了set_和get_,这样编译器会自动生成一个伪成员变量Size,这个变量名是set_和get_成员函数后面的名称。注意不要再在get_成员函数代码中使用这个伪成员变量Size,它会引起该函数的递归调用。

  (5) 托管C++的委派

  在C/C++中,一个函数的地址就是内存地址。这个地址不会带有任何其它附加信息,如函数的参数个数、参数类型、函数的返回值类型以及这个函数的调用规范等。总之,C/C++的回调函数不具备类型安全性。而.NET框架在回调函数的基础增加了提供类型安全的机制,称为委派。

  托管C++的委派方法不像C#那么复杂,它简化了委派绝大部分的内部机制,因而使得它的使用变成非常简单容易。例如下面的代码:

#using 
using namespace System;

__delegate int GetDayOfWeek(); // 委派方法的声明
__gc class MyCalendar
{
public:
MyCalendar() : m_nDayOfWeek(4) {}
int MyGetDayOfWeek() {
Console::WriteLine("非静态方法"); 
return m_nDayOfWeek; 
}
static int MyStaticGetDayOfWeek() { 
Console::WriteLine("静态方法"); 
return 6; 
}
private:
int m_nDayOfWeek;
};

int main(void)
{
GetDayOfWeek * pGetDayOfWeek; // 声明委派类型变量
int nDayOfWeek;

// 将类的静态方法MyStaticGetDayOfWeek绑定成委派
pGetDayOfWeek = new GetDayOfWeek(0, &MyCalendar::MyStaticGetDayOfWeek);
nDayOfWeek = pGetDayOfWeek->Invoke(); // 委派的调用
Console::WriteLine(nDayOfWeek);

// 将一个类的实例绑定成委派
MyCalendar * pcal = new MyCalendar();
pGetDayOfWeek = 
static_cast(Delegate::Combine(pGetDayOfWeek,
new GetDayOfWeek(pcal, &MyCalendar::MyGetDayOfWeek)));
nDayOfWeek = pGetDayOfWeek->Invoke();
Console::WriteLine(nDayOfWeek);

// 删除绑定委派的类实例
pGetDayOfWeek = 
static_cast(Delegate::Remove(pGetDayOfWeek,
new GetDayOfWeek(pcal, &MyCalendar::MyGetDayOfWeek)));

return 0;
}

  输出结果是:

   静态方法
  
   6

   静态方法

   非静态方法

   4

  4、结速语

  总之,使用托管C++是C++程序员编写.NET框架应用程序最好的一种选择,在充分理解.NET框架基础上,避免了使用其他语言如C#、VB.NET所带来的额外开销。
posted @ 2008-10-24 11:43 BeyondCN 阅读(235) | 评论 (0)编辑 收藏

我心目中的编程高手(完整版)

-- Bill Joy MIT BBS上说微软电话面试的一道题就是“Who do you think is the best coder, and why?”。我觉得挺有意思的,也来凑个热闹。排名不分先后。

心目中的编程高手 (1)

Joy.Colloquium.png    Bill Joy , 前任Sun的首席科学家,当年在Berkeley时主持开发了最早版本的BSD。他还是vi和csh的作者。当然,Csh Programming Considered Harmful 是另一个话题乐。据说他想看看自己能不能写个操作系统,就在三天里写了个自己的Unix, 也就是BSD的前身。当然是传说了,但足见他的功力。另一个传说是,1980年初的时候,DARPA让BBN在Berkley Unix里加上BBN开发的TCP/IP代码。但当时还是研究生的B伯伯怒了,拒绝把BBN TCP/IP加入BSD,因为他觉得BBN的TCP/IP写得不好。于是B伯伯出手了,端的是一箭封喉,很快就写出了高性能的伯克利版TCP/IP。当时 BBN和DARPA签了巨额合同开发TCP/IP Stack,谁知他们的代码还不如一个研究生的好。于是他们开会。只见当时B伯伯穿个T-shirt出现在会议室(当时穿T-shirt不象现在,还是相 当散漫的哈)。只见BBN问:你怎么写出来的?而B伯伯答:简单,你读协议,然后编程就行了。最令偶晕倒的是,B伯伯硕士毕业后决定到工业界发展,于是就 到了当时只有一间办公室的Sun, 然后他就把Sparc设计出来乐... 象这种软硬通吃的牛人,想不佩服都不行的说。据Bill Joy的同事说,一般开会的时候B伯伯总是拿一堆杂志漫不经心地读。但往往在关键之处,B伯伯发言,直切要害,提出漂亮的构想,让同事们彻底崩溃。对了,他还是Java Spec和JINI的主要作者之一。

心目中的编程高手 (2)

John.Carmack.png    John Carmack ,ID Software的founder和Lead Programmer。上个月和一个搞图形的师兄聊天,他竟然不知道John Carmack, 也让偶大大地晕了一把。不过也许搞研究的和搞实战的多少有些隔吧。想必喜欢第一人称射击游戏的都知道J哥哥。90年代初只要能在PC上搞个小动画都能让人 惊叹一番的时候,J哥哥就推出了石破天惊的Castle Wolfstein, 然后再接再励,doom, doomII, Quake...每次都把3-D技术推到极致。J哥哥的简历上说自己的专长是"Exhaust 3-D technology",真是牛人之言不我欺的说。做J哥哥这样的人是很幸福的,因为各大图形卡厂家一有了新产品就要向他“进贡”,不然如果他的游戏不支 持哪种卡,哪种卡基本就会夭折乐。当初MS的Direct3D也得听取他的意见,修改了不少API。当然,J哥哥在结婚前十数年如一日地每天编程14小时 以上,也是偶们凡人望尘莫及的。对了,J哥哥高中肆业(?!),可以说是自学成才。不过呢,谁要用这个例子来为自己学习不好辩护,就大错特错了。那 Leonardo Da Vinci还是自学成才呢(人是私生子,不能上学)。普通人和天才还是有区别的。对了,其实偶们叫“达分奇”是相当不对的,因为Vinci是地名,而Da Vinci就是从Vinci来的人的意思。换句话说,Leonardo Da Vinci就是“从Vinci来的Leonardo”的意思。叫别人“Da Vinci”就不知所谓乐。嗯,扯远了,打住。

心目中的编程高手 (3)

David.Cutler.png    David Cutler ,VMS 和Windows NT的首席设计师,去微软前号称硅谷最牛的kernel开发员。当初他和他的手下在微软一周内把一个具备基本功能的bootable kernel写出来,然后说:"who can't write an OS in a week?",也是牛气冲天的说。顺便说一句,D爷爷到NT3.5时,管理1500名开发员,自己还兼做设计和编程,不改coder本色啊。D爷爷天生脾 气火爆,和人争论时喜欢双手猛击桌子以壮声势。:-) 日常交谈F-word不离口。他面试秘书时必问:"what do you think of the word 'FUCK'?",让无数美女刹羽而归。终于有一天,一个同样火爆的女面对这个问题脱口而出:"That's my favorite word"。于是她被录取乐,为D爷爷工作到NT3.5发布。

心目中的编程高手 (4)

Donald.E.Knuth.png    Donald E. Knuth 。 高爷爷其实用不着偶多说。学编程的不知道他就好像学物理的不知道牛顿,学数学的不知道欧拉,学音乐的不知道莫扎特,学Delphi的不知到Anders Hejlsberg,或者学Linux不知道Linus Torvalds一样,不可原谅啊。:-) 为了让文章完整,就再罗唆几句吧。高爷爷本科时就开始给行行色色的公司写各种稀奇古怪的编译器挣外快了。他卖给别人时收一两千美元,那些公司拿了 code,加工一下卖出去就是上万上十万。不过也没见高爷爷不爽过,学者本色的说。想想那可是60年代初啊,高爷爷写编译器写多了,顺带就搞出了个 Attribute Grammar和LR(k),大大地造福后人啊。至于高爷爷在CalTech的编程比赛(有Alan Kay得众多高高手参加)总是第一,写的Tex到86年就code freeze,还附带2^n美分奖励等等都是耳熟能详,偶就不饶舌乐。顺便说一下,高老大爷是无可争议的写作高手。他给Concrete Mathematics写的前言可谓字字铿锵,堪为前言的典范。他的技术文章也是一绝,文风细致,解释精当,而且没有学究气,不失轻快跳脱。记得几年前读 Concrete Mathematics,时不时开怀大笑,让老妈极其郁闷,觉得我nerdy到家,不可救药。其实呢,子非鱼,安知鱼之乐,更不知那完全是高爷爷的功劳。 说到写作高手,不能不提Stephen A. Cook。他的文章当年就被我们的写作老师极力推荐,号称典雅文风的样本。库爷爷一头银发,身材颀长,总是面带谦和的微笑,颇有仙风道骨,正好和他的仙文 相配的说。高爷爷其实还是开源运动的先驱。虽然他没有象Richard Stallman那样八方奔走,但他捐献了好多作品,都可以在网上看到,比如著名的Mathematical Writing,MMIXWare,The Tex Book等,更不用说足以让他流芳百世的Tex乐。

心目中的编程高手 (5)

Ken.Thompson.png    Ken Thompson ,C 语言前身B语言的作者,Unix的发明人之一(另一个是Dennis M. Riche老大,被尊为DMR),Belle(一个厉害的国际象棋程序)的作者之一,操作系统Plan 9的主要作者(另一个是大牛人Rob Pike, 前不久被google挖走了)。Ken爷爷也算是计算机历史上开天辟地的人物了。1969年还是计算机史前时代,普通人都认为只有大型机才能运行通用的操 作系统,小型机只有高山仰止的份儿。至于用高级语言来写操作系统,更是笑谈。Ken爷爷自然不是池中物,于是他和DMR怒了,在1969年到1970间用 汇编在PDP-7上写出了UNIX的第一个版本。他们并不知道,一场轰轰烈烈的UNIX传奇由此拉开了序幕。Ken爷爷在1971年又把Unix用C重 写,于是C在随后20年成就了不知多少豪杰的梦想和光荣。Ken爷爷还有段佳话:装了UNIX的PDP-11最早被安装在Bell Lab里供大家日常使用。很快大家就发现Ken爷爷总能进入他们的帐户,获得最高权限。Bell Lab里的科学家都心比天高,当然被搞得郁闷无比。于是有高手怒了,跳出来分析了UNIX代码,找到后门,修改代码,然后重新编译了整个UNIX。就在大 家都以为“这个世界清净了”的时候,他们发现Ken爷爷还是轻而易举地拿到他们的帐户权限,百思不解后,只好继续郁闷。谁知道这一郁闷,就郁闷了14年, 直到Ken爷爷道出个中缘由。原来,代码里的确有后门,但后门不在Unix代码里,而在编译Unix代码的C编译器里。每次C编译器编译UNIX的代码, 就自动生成后门代码。而整个Bell Lab的人,都是用Ken爷爷的C编译器。

心目中的编程高手 (6)

Rob.Pike.png    Rob Pike , AT&T Bell Lab前Member of Technical Staff,现在google研究操作系统。罗伯伯是Unix的先驱,是贝尔实验室最早和Ken Thompson以及Dennis M. Ritche开发Unix的猛人,UTF-8的设计人。他还在美国名嘴David Letterman的晚间节目上露了一小脸,一脸憨厚地帮一胖子吹牛搞怪。让偶佩服不已的是,罗伯伯还是1980年奥运会射箭的银牌得主。他也是个颇为厉 害的业余天文学家,设计的珈玛射线望远镜差点被NASA用在航天飞机上。他还是两本经典,The Unix Programming Environment 和 The Practice of Programming 的作者之一。如果初学者想在编程方面精益求精,实在该好好读读这两本书。它们都有中文版的说。罗伯伯还写出了Unix下第一个基于位图的窗口系统,并且是 著名的blit终端的作者。当然了,罗伯伯还是号称锐意革新的操作系统,Plan9,的主要作者。可惜的是,Plan9并没有引起多少人的注意。罗伯伯一 怒之下,写出了振聋发聩的雄文 Systems Software Research is Irrelevant,痛斥当下系统开发不思进取,固步自封的弊病。虽然这篇文章是罗伯伯含忿出手,颇有偏激之词,但确实道出了系统开发的无奈:开发周期 越来越长,代价越来越大,用户被统一到少数几个系统上,结果越来越多的活动是测量和修补,而真正的革新越来越少。就在罗伯伯郁闷之极的时候,google 登门求贤来乐。如果说现在还有一家大众公司在不遗余力地把系统开发推向极致的话,也就是google乐。随便看看google的成果就知道了。具有超强容 错和负载平衡能力的分布式文件系统GFS(现在能够用100,000台廉价PC搭起一个巨型分布系统,并且高效便宜地进行管理的系统也不多哈),大规模机 器学习系统(拼写检查,广告匹配,拼音搜寻。。。哪个都很牛的说),更不用说处理海量并行计算的各式google服务了。Rob在System Software Research is Irrelevant里萧瑟地说现在没有人再关心系统研究的前沿成果了。想不到他错了,因为google关心。google网络了大批功成名就的牛人,还 有大量初生牛犊般博士做开发,显然不是没事耍酷,而是因为它们的开发总是试图吸取系统研究的最新成果。想必Rob Pike在google很幸福。愿他做出更棒的系统。

心目中的编程高手 (7)

Dennis.M.Ritchie.png    Dennis M. Ritchie 既然Ken Thompson是我的偶像,新闻组上人称DMR的Dennis M. Ritchie自然也是,毕竟两人共同缔造了UNIX,而Dennis几乎独力把C搞大(当然,C的前身是B,而B是Ken Thompson一手做出来的)。J D两人1983年分享图灵奖,是有史以来少数几个因工程项目得奖的工程师(本来是唯一的一对儿,但Alan Kay才因为SmallTalk得奖,所以就成了唯二的乐)。一个人一生能做出一个卓越的系统已经不易,DMR的C和UNIX长盛不衰近30年,至今生机 勃勃,DMR此生可以无憾的说。D爷爷也算有家学渊源:他老爸在AT&T贝尔实验室工作了一辈子,并在电路设计方面卓有成就,还出了本颇有影响的 书The Design of Switching Circuits,据说在交换理论和逻辑设计方面有独到的论述。当然,D爷爷和他老爸是不同时代的人:他老爸的研究成形于晶体管发明之前,而D爷爷的工作 离了晶体管就玩儿不转乐。:-D不要看D爷爷搞出了C,其实他最爱的编程语言是Alef,在Plan9上运行,支持并行编程。Alef的语法和C相似,但 数据类型和执行方式都和C大大不同。说到语言,D爷爷对后来人有非常中肯的建议:抱着学习的目的来开发你自己的语言,不要冀望于它被众人接受。这个建议不 光对语言开发有用,也适用于其它大型系统的开发。别的不说,DMR后来领导自己的团队在1995年和1996分别推出了Plan9和Inferno操作系 统,又用多少人知道呢?其实,D爷爷当初也没想过C会风行世界。他开发C的初衷和Eric S. Raymond在Cathedral and Bazaar里阐述的一样,就是要消除自己对现有工具的不爽之处。谁知D爷爷无心插柳,C竟然受到众多程序员的狂热拥戴,连D爷爷自己都大惑不解。在一次 采访中D爷爷说大概那是因为C的抽象程度碰巧既满足了程序员的要求,又容易实现。当然C一度是Unix上的通用语言也是原因。但不管怎么说,D爷爷对编程 语言出色的审美意识奠定了C广为流传的基础。最后八卦一下。D爷爷的业余爱好和NBA大牛Karl Malone一样:开卡车。不过D爷爷更喜欢开NASCAR,而KM独爱巨无霸。J D爷爷自称心中不供偶像,如果一定要说一个,那就是Ken Thompson了。现在Ken爷爷退休当飞机教练去了,而D爷爷当了贝尔实验室系统开发部的头,整日忙于开支票。他俩合作20年,屡屡创造历史。这段令 人神往的佳话,也就长留你我心中乐。P.S.,很多人都以为Brian W. Kernighan是C的作者。其实BWK只是写了那本经典K&R C。据D爷爷说,他,Ken和Kernighan三人中,Kernighan最能写文章,他次之,而Ken写得最少;但说到编程,Ken爷爷才是当之无愧 的老大。

心目中的编程高手 (8)

Edsger.Wybe.Dijkstra.png    Edsger Wybe Dijkstra 对,就是E.W. Dijkstra. 一提到EWD,很多人就会想起找最短路径的Dijkstra Algorithm,就好像一提到Sir. Tony Hoare,就想起Quick Sort一样。其实这些个算法不过是两个牛人在他们职业生涯中最琐碎的贡献。比如Dijkstra算法,无非是戴爷爷在1956年为了展示新计算机 ARMAC的计算能力,初试身手的成果,属于他的算法处女作。据戴爷爷自述,他搞出最短路径算法的时候连纸笔都没用。当时他和他老婆在阿姆斯特丹一家咖啡 厅的阳台上晒太阳喝咖啡,突然就把这个算法想出来乐。而且当时的算法研究还比较原始,牛人们忙着用计算机搞数值计算,对离散算法不屑一顾。那时连一个象样 的专注于离散算法的专业期刊都没有。戴爷爷于是推迟发表这个算法。直到1959年,他才把这个算法发表在Numerische Mathematik的创刊号上,权为捧场。:-) EWD在多个领域牛气冲天,端的是理论和编程两手硬的高手。只不过他的很多工作比较深刻,学校的老先生们觉得本科生接受不了,不给本科生讲而已。戴爷爷大 概因为最短路径算法一战成名,于是有人请他参加另一台计算机X1的设计工作,并且把设计实时中断系统的任务派给了他。现在看来实时中断也许不算什么,但要 知到,X1前根本就没有实时中断的概念。实现它简直就是一场豪赌。戴爷爷起初还不情愿,但经不住项目负责人Bram和Carel的轮番“吹捧”:我们知道 实时中断让您工作变得非常困难,但象您这样的牛人肯定能做出来的说。结果戴爷爷被糖衣炮弹彻底击穿,接下了这个烫手山芋。两三年后,他不仅搞出了实时中 断,还围绕这个写出了自己的博士论文,顺利戴上博士帽。让戴爷爷真正成名立万的还是在X1上开发的Algo60,最早的高级语言之一。戴爷爷没日没夜地工 作了8个月,就搞出了Algo60,也因此获得了1972年的图灵奖。因为Algo60,戴爷爷发表了一篇石破天惊的文章:Recursive Programming,于是人们才知道,原来高级语言也可以高效地实现递归,原来从此以后,所有程序员都不可避免地和戴爷爷发明的一个词(应该说是概 念)打交道:堆栈。而且Algo60还让戴爷爷深入地思考多道程序设计的问题,最终发明了每个系统程序员都绕不开的概念:semaphore。当然,戴爷 爷总是把他发明的概念严格形式化,极具科学家本色的说。和这些成就想比,他提出的吃饭的哲学家问题,也就没什么好说的了。说来好笑,当时的大学(忘了哪所 了)还是觉得戴爷爷没有受过正统的数学训练,也不是专门搞数值分析的,所以最后不太情愿地给了他一个教职。这种小挫折并不能妨碍象戴爷爷这样的牛人创造历 史。他一边教数值分析(:-D),一边开始开发一个新的操作系统,并培养计算机科学家。几年后,THE Multiprogramming System横空出世。THE是第一个支持松散耦合,显式同步的进程并由此使得严格证明系统没有死锁变得容易的操作系统。可惜戴爷爷任职的系不识货,还强 行解散了他的研究小组(1972年戴爷爷给他的系主任说他得了图灵奖,系主任的第一反应是你们搞计算机就喜欢乱发奖)。这让戴爷爷相当郁闷,得了抑郁症。 在极度郁闷之中,戴爷爷决定用写作来治疗自己的抑郁症。于是经典就诞生乐:Notes on Structured Programming。戴爷爷从此被尊为结构化编程的奠基人,而且他的抑郁症也被治好乐。EWD太牛,结果他的故事也太多。先到这里吧。1973起,他 的故事就在美国发生了。

心目中的编程高手 (9)

Anders.Hejlsberg.png    Anders Hejlsberg , 微软.NET的首席架构师,编程语言设计和实现的顶尖高手。他一手做出了Turbo Pascal,也是Delphi, J++(尤其是WFC),C#和.NET的主要作者。这些作品的名字足以为他立传。作为一个程序员,我在这样的大师面前实在无语。生子当如Anders的 说。李维的《Borland传奇》里已详细讲述了Anders的传奇故事,我就不用费舌了:http://java.mblogger.cn/iexploiter/posts/1505.aspx。Artima上有Anders谈C#的系列访谈。MSDN上有一段Anders导游的录像。有兴趣可以去看看牛人的丰采。 
posted @ 2008-10-22 21:29 BeyondCN 阅读(100) | 评论 (0)编辑 收藏

黑客书架上出现频率最高的9部半书籍


每一位黑客都需要一个坚实的图书馆来寻找灵感以及查找参考资料。这儿的列表能给你一些你想要的东西,里面既有计算机科学的顶级大学教材,也有对业界的真知灼见,还有你不可或缺的参考书籍。它囊括了黑客的经典著作。 

人月神话:软件工程评述-周年版 

Fredrick P. Brooks著 

这本论述软件工程中人的因素的经典著作出版于1975年。这些年来,技术已经发生了很大的变化,但是人的因素还是和原来一样让人头痛。这是一本有深刻洞察力的书籍,也是一本在业界非常著名,常常被引用的书籍。《人月神话》概括了许多在大中型项目中经常遇到的,也是非常致命的问题。它提出了2条著名的准则: 

◦人月神话:向一个已经延后的项目中投入更多的人力资源只会让它更延后 
◦没有银弹:没有一种策略,技术或者技巧可以极大地提高程序员的生产力 
我不仅向程序员推荐这本书,也想任何一个项目管理人员推荐这本书。项目经理和程序员都会喜欢布鲁克斯清楚而明晰的观点。 

C 程序设计语言(第二版) 


这是一本权威的C语言参考书籍,人们通常叫它K&R。它无比精炼,同时也能恰到好处地给初学者提供足够的信息。K&R提供的信息刚好是你需要的,不多也不少。274页的篇幅是你说能发现的参考书中最紧凑的。我敢说Java的作者是很难写出如此简明扼要的著作。 

这本书适合任意一个学习C语言或者想寻找C语言参考书的人。K&R也是任何一位想撰写语言参考或者技术著作的人必读的书目。 

如果你没有任何的编程经验,K&R不太适合做为起点。但是如果你足够有冲劲的话,它还是能让你学到不少东西。初学者需要去买一本答案,它提供了所有练习的详细解释。 

计算机程序设计与解释 (第二版) 

Harlod Abelson和Gerald Jay Sussman著 

SICP是一本被很多顶级高校,诸如加州大学伯克利分校,麻省理工学院等,使用的入门书籍。它用Scheme语言介绍了许多强大的范例,比如递归,lamda表达式,抽象以及解释性语言。 

我发现这本书做为入门教材是难以想象的厚重。我工作了几年并且对这些东西有了更深的了解以后,再来重新读这本书,仍然学到了很多东西。 

如果你在课堂上没用到这本书,我推荐你把它找来仔细看看自己遗漏了什么,特别是你没用使用过LISP这样的语言的话。 

代码大全2:软件架构的实用手册 

Steve McConnell著 

《代码大全2》是一本在软件架构方面得到高度评价的书。McConnell在书中定义了主要的编程和调试的架构,也阐述了一些架构设计,详细设计,单元测试,整合和整合测试的内容。 

这本书的主要目的是让你写出更好的代码。McConnell涉及了包括管理软件复杂度,重构,代码风格和写出优美的注释等方方面面的内容。 

这本书推荐给任何一个想写出健壮的代码的人。当你学习到了良好的代码实践,那么你就会节约很多起步的时间;同时,它对于有多年经验的程序员也能帮助他们改变自己不好的开发习惯。 

算法简介 

Thomas H. Cormen,Charles E. Leiserson,Ronald L. Rivest 和 Clifford Stein著 

这是另外一本教材。《算法简介》也许是大学中使用的最多的算法教材。它同时也是一本非常好的参考书。 

尽管在实际情况中大部分程序员在生产环境中都不会自己去写诸如快速排序这样的算法实现,但是算法知识是了解你所应用的库以及你自己代码实际效率的基础。 

《算法简介》被推荐给任何一个想完善自己算法技巧的开发人员,它也被推荐给那些对NP完备性,随机算法,快速傅立叶变换等课题感兴趣的人。阅读这本书也需要良好的数学知识。 

设计模式:可复用的面向对象软件的原则 

Erich Gamma,Richard Helm,Ralph Johnson和John M. Vlissides著 

这本书阐述了各种面向对象的设计模式。对于书中23种模式的每一种,作者都给出了深度分析,这些分析包括清晰的示例,常见的缺陷,相关的模式,用C++或者SmallTalk写的示例代码。这些模式涵盖了单件模式,观察者模式,模板方法模式,迭代器模式和代理模式。 

这本书对于使用面向对象语言的中级或者高级开发者是必读书目。刚刚进入面向对象开发的开发人员最好在掌握了面向对象语言以及在非实验性项目中深入实践以后再来学习里面的模式。否者你学到的东西不可能是很牢靠的。 

编程珍珠 (第二版) 

Jon Bentley著 

这本书在学习解决问题的技巧方面非常突出。15章的每一个章节都对应着一个任务,例如排序电话号码,创建回文词或者搜索文本。Bentley先定义问题,然后再提出不同的解决方案,提供了讨论和对每个解决方案清晰的分析,最后再给出了编程的基本原则。 

《编程珍珠》包含了一些非常聪明的主意,它们可以用来做为解决一些小问题的时候做为参考。但是这本书更有用的地方是如何从工程师的角度解决问题。 

我把这本书推荐给每一位享受编程工作的人。 

编译器:原则,技术和工具 

Alfred V. Aho, Ravi Sethi 和Jeffrey D. Ullman著 

《编译器:原则,技术和工具》通常被叫做“龙书”(封面上有一条红色的龙)。它是编译原理课堂上的标准图书。它涵盖了你想知道的编译器的各方面:文法,分析器,词法分析,语法,中间语言的产生,运行时环境,优化等等。如果你对这些东西还没有足够的了解的话,那么你就要准备去学习一些新的术语和概念,比如确定性有限自动机,有限状态自动机,LR剖析器等等。 

我很喜欢龙书的各部分并且对里面的数学概念和理论很感兴趣(它们贯穿了整本书)。如果你很喜欢正则表达式和状态机,那么你会很喜欢这本书。另外一方面,如果你想知道一些现代编译器的实现原理,你可能无法在里面找到你所需要的东西。龙书是1986年出版的,不能涵盖这些现代的话题。 

Unix强大工具 第三版 

Shelley Powers,Jerry Peek,Tim O' Reilly和Mike Loukides著 

这本书是O'Reilly出版社出版的很多伟大著作中的一本。《Unix强大工具》达到了1200页,完全描述了Unix下面命令行工具,用法,脚本语法示例。 

《Unix强大工具》是一本组织的非常好的参考书。如果你依次读下去,你会发现自己会变成让人惊讶的计算机瘾君子典型代表。 

这本书里面大部分内容都可以在Google上面搜索到,但是有时候我们也需要这样一本很好的参考书。 

这本书是为数不多的适合于初学者和专家的书籍之一。不管是Unix新手还是有多年经验的系统管理员都能从这本书获益。 

便车旅行者指南终极收藏版:5部完整的小说和一个故事 

Douglas Adams著 

这不是一本技术书籍。但是如果你没读过这部便车旅行者三部曲,你就不可能摘掉计算机瘾君子的帽子。它其实包含了5本书,《银河便车指南》,《宇宙尽头的旅馆》,《生活,宇宙和一切》,《再见,谢谢那些鱼》,《大部无害》,再加上一篇短篇小说《小柴法德谨慎行事》 

在发现对生活,宇宙和一切的答案中找到愉悦。学习如何制作Pan Galactic Gargle Blaster(这应该是一种饮料,但是不知道怎么翻译。出处在这儿:http://ywsl.com/bbs/bbsshow.aspx?id=42780 

The Hitch Hiker's Guide to the Galaxy also mentions alcohol. It says that the best drink in existence is the Pan Galactic Gargle Blaster.It says that the effect of a Pan Galactic Gargle Blaster is like having your brains smashed out by a slice of lemon wrapped round a large gold brick. 
),而这一切都是毫不痛苦的。 

这个版本有漂亮的黑色皮革封面,还有丝带书签。阅读的时候就好像在读一本很好的圣经,而且还更可信。(我要在某些喜欢争辩的人发现我之前收回我的话,这只是一个玩笑而已啦) 
posted @ 2008-10-21 13:27 BeyondCN 阅读(384) | 评论 (1)编辑 收藏
epoll是多路复用IO(I/O Multiplexing)中的一种方式,但是仅用于linux2.6以上内核,在开始讨论这个问题之前,先来解释一下为什么需要多路复用IO.

以一个生活中的例子来解释.

假设你在大学中读书,要等待一个朋友来访,而这个朋友只知道你在A号楼,但是不知道你具体住在哪里,于是你们约好了在A号楼门口见面.

如果你使用的阻塞IO模型来处理这个问题,那么你就只能一直守候在A号楼门口等待朋友的到来,在这段时间里你不能做别的事情,不难知道,这种方式的效率是低下的.

现在时代变化了,开始使用多路复用IO模型来处理这个问题.你告诉你的朋友来了A号楼找楼管大妈,让她告诉你该怎么走.这里的楼管大妈扮演的就是多路复用IO的角色.

进一步解释select和epoll模型的差异.

select版大妈做的是如下的事情:比如同学甲的朋友来了,select版大妈比较笨,她带着朋友挨个房间进行查询谁是同学甲,你等的朋友来了,于是在实际的代码中,select版大妈做的是以下的事情:

int n = select(&readset,NULL,NULL,100);

for (int i = 0; n > 0++i)
{
   
if (FD_ISSET(fdarray[i], &readset))
   {
      do_something(fdarray[i]);
      --n;
   }
}

epoll版大妈就比较先进了,她记下了同学甲的信息,比如说他的房间号,那么等同学甲的朋友到来时,只需要告诉该朋友同学甲在哪个房间即可,不用自己亲自带着人满大楼的找人了.于是epoll版大妈做的事情可以用如下的代码表示:
n=epoll_wait(epfd,events,20,500);
    
for(i=0;i<n;++i)
{
    do_something(events[n]);
}

在epoll中,关键的数据结构epoll_event定义如下:
typedef union epoll_data {
                
void *ptr;
                
int fd;
                __uint32_t u32;
                __uint64_t u64;
        } epoll_data_t;

        
struct epoll_event {
                __uint32_t events;      
/* Epoll events */
                epoll_data_t data;      
/* User data variable */
        }; 
可以看到,epoll_data是一个union结构体,它就是epoll版大妈用于保存同学信息的结构体,它可以保存很多类型的信息:fd,指针,等等.有了这个结构体,epoll大妈可以不用吹灰之力就可以定位到同学甲.

别小看了这些效率的提高,在一个大规模并发的服务器中,轮询IO是最耗时间的操作之一.再回到那个例子中,如果每到来一个朋友楼管大妈都要全楼的查询同学,那么处理的效率必然就低下了,过不久楼底就有不少的人了.

对比最早给出的阻塞IO的处理模型, 可以看到采用了多路复用IO之后, 程序可以自由的进行自己除了IO操作之外的工作, 只有到IO状态发生变化的时候由多路复用IO进行通知, 然后再采取相应的操作, 而不用一直阻塞等待IO状态发生变化了.

从上面的分析也可以看出,epoll比select的提高实际上是一个用空间换时间思想的具体应用

posted @ 2008-10-16 09:40 BeyondCN 阅读(267) | 评论 (0)编辑 收藏
仅列出标题
共2页: 1 2