http://mp.weixin.qq.com/s/qCsa7k9ksS6B2GeArOS7TA

2016-12-18 吴郢 视觉求索 视觉求索

这纷纷扰扰的世界里有一类人,不用媒体加油添醋的鼓吹,也不用自己夸大其词的炫耀。他们看似像平凡人一样,但是他们深邃闪耀的思想,卓越不凡的成就,和坚韧不拔的精神,却格外让人敬仰。很多有志青年拿他们当人生的楷模,可是能得其一二者,都已然是凤毛麟角了。他们从来不用居高临下地说教,盛气凌人般以势压人,始终是平和如一。他们自己平时的一言一行,足以让后辈们汗颜和羞愧。Tom,就是这类真学者的一个典型。

Tom就是Thomas S.Huang教授,大家都亲切地称他Tom。在他50多年活跃常青的学术人生中,辗转于MIT,Purdue,和UIUC,始终领跑在图像处理,计算机视觉,模式识别,人机交互的最前沿,源源不断地有新颖的东西,着实让人景仰和赞叹不已。每年的学术会议,当我们的注意力总是很容易被诸如风景,行情和八卦等等所转移时,我们却总发现一个满头银丝的资深学者,还在认认真真地听报告。这样的Tom只会让我们无地自容。20年以前Tom收我为徒,引领我走进学术研究的世界。经历着混沌,懵懂,自大,迷茫,纠结,开悟等等众法诸象促使我企图去观察,体会,和理解Tom这样的老一代卓越学者的学术人生。

为学日益很多学者学人学生,每天要学习“新”的东西。这当然无可厚非,但是对“日新”的理解,却慢慢变成了只是对热点的追逐。所以,知道的名词是越来越多了,可是对科研的热情却是越来越低了,心气也越磨越消沉了。这样,就被这纷纷扰扰的世界所诱惑,放弃自己最开始的学术理想和追求。结果像这样“日益”般地为学,基本上是难以为继的。所以,那些真正能十年磨一剑的人,少之又少。Tom的研究领域众多,并且都在最前沿,难道他不是在日益地为学?为何他可以有耀眼常青半个多世纪的学术生涯?

从我的视角看他,他的学术人生是一个澹泊的致远的求道人生。

学术本质上追求的是什么?绝对不是论文的数量,也不是学术上的地位,更不是商业化,这都不是学术的objective function。说某某人著作等身,说某某人泰山北斗,说某某人业界领袖,对一个真正的学者来说,这都没啥意义。学术追求的是求真的追求,是去问问题,是去找你believe的正解。这个真,其实就是“道”,是govern万事万物的东西。大道从来都是至简的。从牛顿力学,到麦克斯韦方程,到质能方程,都简洁优美地让人窒息。花里胡哨的东西,鲜能流传久远。正所谓为道日损。如果想求得这个道,就要每天都扔掉一些东西,一些不必要的东西。当这些都扔下了,就近于得道了。在我看来,Tom早已经得到这个道了。

我一直感叹Tom生活的简单。比如连手机,他也是近几年才开始用的。要不是为了和师母联系方便,我估计他会一直不用手机的。他说他是个old-fashion的人。这看似不过是他自嘲的话,但是一如他说话之精简,这句话背后的滋味,如果不认真去体会,一定品不出其中深意。想想,如今没有手机的日子,可能只有超级充实的人,才能选择去过。没有手机的日子,也只有他这样为道日损的人,才能选择去过。不光生活如此,在他的精神世界,他日损的是名利心,完全对名利是不在意的。这也就是他学界业界这么多朋友学生为之赞叹不已的一种境界。

名利心是真正为学的大敌,也当然是为道的大敌。Scholarship的本质是对真”的不二的态度,这也是Tom说他自己old-fashion的另一个重要的意思。现在的new-fashion已经不是求“真”了,而是求“新”,求“异”,求“名”了。所以,大家争先恐后发表一些half-baked的东西,短平快的东西,哪怕一丁点小得不能再小的incremental work也拼命要抢先发表,这才有arXiv这样的东西出现的基础。干脆,要不以后大家都学费尔玛好了,先把碑立上,让后世花300年去证真伪。所以,能在我们这样的现实世界里,坚守old-fashion的,难道不值得我们salute吗?

Tom的科研,半个世纪以来一直引领着好几个领域的前沿,可是他从来没有去争啥啥啥是自己的发现。一个例子是他在Structure from Motion里的贡献。Tom和他的学生R. Y.Tsai早在1981年给出了三维运动和结构的关系和刚体运动估计的唯一解的条件,这是当代三维重建和Structure from Motion的奠基性的工作。这比Longuet-Higgins在1981在Nature上的工作不会晚。Tom和Faugeras在1989年关于Essential Matrix的工作也是立体视觉的里程碑。可是他从来不去争这些虚名。

另一个例子是他在人机交互的研究。早在从80年代末开始,他就开始了人脸的非刚性运动分析,人的表情扑捉和识别,voice-driven talking head,还有手指头的articulated运动分析和gesture recognition的研究。那时,他就开始结合虚拟现实和基于视频的人体的运动扑捉识别。这样的非刚性运动分析的研究,不仅对计算机视觉,而且对计算机图形学,都引发了巨大的变革性的进步。

还有一个例子是他在content-based image retrieval的最先驱的贡献。早在90年代,还没有google的时代,Tom就开始了图像和多媒体搜索的研究。他那时将relevance feedback引入图像搜索,开创了全新的用learning和active learning的方式来研究图像的相似性。这些都是后世image retrieval和image search的基础。   

在我看来,他的澹泊明志才能让他在求道的路上致远。师母曾经说过,他们年轻的时候,那时在MIT,生活也如一般年轻人一样拮据。这半个世纪以来,AI几起几落。Tom这样优秀的人,也多次面临业界的高薪诱惑。可是,他选择了澹泊,选择了求道,选择了宁静致远地求道。求道的路上有师母相伴,人生何其幸也。记得CVPR‘05在San Diego,一天会议下来,傍晚Tom和师母手挽手,光着脚,在海滩边散步。此情此景,惹得大家纷纷羡慕的目光。 

在像Tom这样的人看来,科研有如一种信仰,一种求索,一种信仰。只能心无旁骛,澹泊宁静,才能不被这纷扰的世界扰乱,才能到达遥远的彼岸。这印证了李白的诗句:两岸猿声啼不住,轻舟已过万重山。

我写到这里,突然记得金庸在《神雕侠侣》里有一段话是关于“第三次华山论剑”的,写得有点意思。 “... 第一次华山论剑,郭靖尚未出世,那时东邪、西毒、南帝、北丐、中神通五人,为争一部《九阴真经》,约定在华山绝顶比武较量,艺高者得,结果中神通王重阳独冠群雄,赢得了‘武功天下第一’的尊号。二十五年后,王重阳逝世,黄药师第二次华山论剑,除东邪、西毒、南帝、北丐四人外,又有周伯通、裘千仞、郭靖三人参与。各人修为精湛,各有所长,但真要说到‘天下第一’四字,实所难言,单以武功而论,似乎倒以发了疯的欧阳锋最强。想不到事隔数十年,居然又有一群武林好手,相约作第三次华山论剑。这一招使黄药师等尽皆愕然。更奇的是,眼前这数十人并无一个认得。难道当真‘长江后浪推前浪,一辈新人胜旧人’?难道自己这一干人都做了井底之蛙,竟不知天外有天,人上有人? ...” 
阅读记录:read twice