从早慧少年到青年科学家
陈云霁(左)和陈天石(右)
“DianNao”和“DaDianNao”,是一种人工神经网络芯片一代和二代的名字。听外国人生硬地发着这几个音,许多人都会偷偷发笑。这两种芯片的设计者是一对亲兄弟,参加国际会议时,兄弟俩经常要给外国同行正音,特别是“脑”的三声发音,折磨许多人卷着舌头重复好多遍。可是在他们看来,这更独具魅力,因为之前没有中文发音的芯片。
让科研成果变成一件好玩的事,是陈云霁和陈天石——计算机界的一对“电脑兄弟”的真心希望。
1983年出生的陈云霁,曾任龙芯3号总设计师,获得首届国家自然科学基金优秀青年科学基金,现在计算机体系结构国家重点实验室任研究员。弟弟陈天石曾获中国计算机学会优秀博士论文奖,现在为计算所副研究员。兄弟两个先后毕业于中国科学技术大学少年班。今年1月31日,中国计算机学会(CCF)举行了颁奖大会,陈云霁以第一顺位荣获2014年度CCF青年科学家奖。
2014年是兄弟俩丰收的一年。2014年3月在美国召开的国际顶级学术会议ASPLOS上,“DianNao:一种小尺度的高吞吐率机器学习加速器”获得了最佳论文奖。这不但是大陆科研机构首次在计算机系统和高性能计算领域顶级国际会议上获得最佳论文奖,也是亚洲首次。2014年12月,陈氏兄弟又推出了寒武纪2号神经网络处理器(DaDianNao),荣获2014年度Micro最佳论文。这是Micro自1963年创办以来,美国以外国家首次获得这个奖项。
学术研究,压力与快乐并存
“DianNao”和“DaDianNao”可以概括为体系结构与人工智能交叉研究的成果,这是兄弟两人原来不同研究方向的跨界结合。
体系结构通俗地讲,就是研究如何用晶体管的“砖石”搭出计算机的“大楼”。选择这个方向,源于陈云霁14岁到中国科学技术大学读本科的研究经历。
大三上学期,对未来还有点懵懂的陈云霁把计算机系所有实验室的门挨个敲了一遍,问是否接收本科生。最后,当时教《计算机体系结构》课程的周学海教授所在的实验室收下了他。陈云霁回忆,虽然只是给老师和师兄们打下手,但研发工作让他感到:做一些有实际意义的工程、又是为国产化做贡献是非常快乐的事。
大学最后一年,听说中科院计算所开始研制国产处理器(即龙芯1号)。陈云霁就特别希望能去读研究生:“如果能加入国产处理器的研发团队,那太光荣了。”
2002年,陈云霁心愿达成,来到中科院计算所跟随胡伟武研究员硕博连读,成为国产处理器龙芯研发团队中最年轻的成员。
2007年博士毕业后,陈云霁留在了中科院计算所龙芯团队,在胡老师指导下进行龙芯3号的总体设计。
龙芯3号与龙芯1号、2号有所不同,已从单核发展到多核了。陈云霁对此有个形象比喻:“以前一桌菜给一桌客人吃,现在一桌菜要给8桌客人吃。”
任务和性能要求大大提升,可是陈云霁和同事看了很多论文,也找不到现成的解决方法,只能自己摸索。
最终,他提出了一种巧妙的办法。
2008年北京奥运会举办期间,单位放假。陈云霁在一个没有空调的宿舍里写论文。虽然挥汗如雨,但心里感觉很爽。论文最终被体系结构领域三大旗舰会议HPCA录用,这也是HPCA上第一篇第一作者来自中国大陆的论文。
想让计算机更聪明
2010年,弟弟陈天石毕业,到计算所工作,研究方向是人工智能,这是计算机科学的一个分支,希望用计算机模拟人的智能,并生产出能与人类智能方式相似的的智能机器。
在一个研究所工作,两兄弟经常在一起讨论问题。两人设想“做一个东西让计算机更聪明,终极目标像人一样聪明”。也就是说通过体系结构来设计神经网络芯片,在此之前计算机硬件的速度和功能已经成为神经网络应用的瓶颈。
“在人类所有好奇的事物中,也许智能是最常见但又最神秘的一项。一旦人类能制造出和自己一样具有复杂认知和创造能力的强人工智能计算机,整个人类社会将会跨出前所未有的一大步。”陈云霁介绍,人脑就是利用一个由大量神经元以及连接神经元的突触组成的网络来解决问题。1943年,搞心理学和逻辑学的科学家提出人工神经网络这一概念,但是其发展一直受到传统通用处理器的低性能、高功耗的限制。
“专门的神经网络处理器有需求”——确定了这个目标,“电脑兄弟”开始发力。
但是在实践中,这条道路远没有想象的那么平坦,他们遇到了很多困难。在提出了一系列基于人工智能方法的处理器研发技术,并多次向体系结构顶级会议投稿后,最后都以被拒而告终。研究经费也是一大问题。
这些没有让他们放弃“人工智能”之梦,他们相信,只要把研究做得更深入,外在的困难总是能克服的。
一次偶然的机会,他们向南京大学周志华教授介绍使用人工智能方法来优化处理器结构方面的工作。周老师对此很感兴趣,并敏锐地意识到这类工作正是人工智能基础算法研究者所希望看到的关键应用。在他的鼓励和指导下,陈氏兄弟提出了一种基于半监督学习的处理器结构优化方法,并发表了论文。之后,各种论文不断出来,引起同行关注。
在给这项成果命名的时候,兄弟两个也是费了一番心思,地质年代给了他们灵感。
“我经常看生物进化方面的内容,寒武纪是个转折点,现代动物开始登场,寒武纪大爆炸后,节肢动物、软体动物、腕足动物和环节动物等几乎所有类群祖先在内的大量生物突然出现。在此之前,几乎没有高等动物存在的证据。”于是兄弟俩把成果命名为“寒武纪1号”,“希望新一代计算机走上历史舞台,在人工智能领域开拓一个全新的局面”。
“寒武纪1号”的小名则被兄弟两个搞笑地起名为“DianNao”。
而“寒武纪2号”——“DaDianNao”又有多项突破,性能继续大幅度提高,与通用芯片和GPU相比,计算速度提高几十倍,功耗只有十分之一,整体能效提高450倍。
“如果用在手机上,图像、语音识别能力大大增强,而由于省电,电池待机时间会大大提高。”陈云霁透露,这种芯片将用在国产手机上。
“我们的梦想不是准确模拟人类的大脑,而是制造出强人工智能”,谈到这个领域的下一步发展,陈云霁的观点是:“一旦实现人类级别的强人工智能,凭借机器智能和脑机接口,人类将拥有近乎无限的记忆和计算能力,甚至无限的创造力,最终使得生物的进化迈上一个新的台阶,成为更高级的形态。”目前,他们已经着手开始和神经学研究者进行新的跨界合作。
学术枯燥,兴趣最重要
“寒武纪”的成功让陈云霁和陈天石兄弟备受关注,但甘苦自知。
兄弟俩对神经网络研究一开始只是在本身的科研任务之外进行的,没有立项更没有经费,后来只是有了陈天石青年科学基金的20万元项目经费,“学术很枯燥,兴趣是最大的支撑”。
“无兴趣驱动无法成为学术领先者。”陈云霁越来越体会到:如果只跟学术热点,不可能有大成果,“我们这个领域,很难跟上国际热点,看到别人发了文章,起码已经是两年前的工作了。有兴趣,就能发现别人没有认识到的方面,有眼光也才能做别人不愿做的事。”
当然,陈云霁知道,心理承受能力也非常重要,“我们年轻,即使失败了也没有关系”。
兄弟两个一个14岁上大学,一个16岁上大学,“神童兄弟”一直是他们头上的光环。对此,陈云霁不认同:“我们绝对不是神童,顶多算是‘早慧少年’,3岁多时1、2、3都数不清楚。”
回想起来,陈云霁认为自己的成长要归功于父母的教育。父母除了看了许多关于教育的书,还有很多办法。小时候,父母经常讲科学家的故事激励他们,还善用“激将法”。陈云霁记得,爸妈买回一套《十万个为什么》但是告诉他,你还小看不懂,大了才能看。“这让我好奇心更强了,偷偷找出来拼命看。”
当然,父母对于兄弟的功课抓得很紧,陈云霁小学三年级把全部小学数学课程学完,9岁时小学毕业,已经把初中数学课程学完。同时考上了南昌十中的少年班。
不过在整个中学期间,除了数学多次拿过奥赛一等奖,陈云霁在班里整体成绩并不突出。打游戏、看漫画也占去了不少时间,甚至不去参加月考。不过,他有自己的“科学家”梦想,知道考上好的大学是先决条件,所以在高考前真正努力了一段时间。
高考时,陈云霁数学考得很好,但满分150分的语文,他只考了80分。陈云霁从自己的成长经历体会到,少年班的孩子还是适合搞科研,尤其适合做基础研究。
经过十多年的学术研究,陈云霁越发觉得语文这门功课的重要:“语文小学时就不及格,后来又跳级提前上中学,语文成绩一直不好。最头疼写作文,这既与思维方式有关系,也与年龄小、阅读少有关系。但是写报告、与人交流都离不开文字表达。搞科学研究就更需要论文写作的能力。”
陈云霁现在觉得自己写文章文笔流畅多了,所以他认为中学老师除了让学生学写记叙文、议论文,还应该练习说明文,因为这对于今后选择理工科的学生太重要了:“理工科学生脑子里逻辑清晰,但还是要能完整而清晰地表达出来。”(本报记者 李新玲)
来源:《 中国青年报 》( 2015年02月16日 12 版)