摘要:读硕博期间,谭光明师从高性能计算领域专家孙凝晖院士,围绕生命科学数据处理加速,以及高性能优化技术等开展工作,并逐步参与到曙光4000的研究当中。谭光明读博士期间的第一个项目即研究高性能计算机在生命科学领域的运用,为人类基因组的分析、病毒演化的分析提供研究支持。


得知荣获“全国向上向善好青年”(创新创业)的荣誉,谭光明还是很感欣喜、意外与感动。“这不仅仅是荣誉,还有一份个人的自我满足和成就感。特别感谢大家的支持,也很感恩自己的工作被单位的推荐和认可。另外,感受很深刻的一点是,不管做哪个行业,只要兢兢业业,一直踏实工作,一定会得到认可。”

谭光明从一名研究员,成长为中国科学院计算技术研究所高性能计算机研究中心主任,已攀登高性能计算机研究的“险峰”十余年。

这当中既有高处不胜寒的艰难,更有“曙光”出现时的喜悦与自豪。所谓高性能计算机,就是计算速度高、程序容量大、通信能力强的性能很高的计算机。

近年来,在气候气象、药物筛选、油田开采、飞机船舶制造等等领域,都活跃着曙光公司(中科曙光)高性能计算机的产品和技术。

从曙光一号到曙光6000、7000,以及人工智能时代下的研究探索,谭光明和众多科研人员始终奔跑向前,以自我突破、自主创新,让世界见证着中国的超算速度。

“这是值得一辈子耕耘的方向”

1980年代,谭光明出生于湖南农村一户普通家庭。在初中班主任何华英的启蒙下,爱因斯坦、陈景润、华罗庚等众多科学家的故事激励着谭光明,在当时优先考虑读中专的背景下,他立志读大学,成为一名科学家。

从湘潭大学数学系,再到中国科学院计算机专业的硕博连读,脚下的路渐渐清晰。

“我们当时的数学系除了数值计算,也开设有编程课,这些其实和现在的工作很相关。大二时,我开始选修、旁听计算机系的相关课程,觉得编程这些都很有意思。”谭光明回忆道。

读硕博期间,谭光明师从高性能计算领域专家孙凝晖院士,围绕生命科学数据处理加速,以及高性能优化技术等开展工作,并逐步参与到曙光4000的研究当中。

孙凝晖院士的要求严格和细致,“包括我们确定一个研究的课题,找解决的方法、关键的技术,他会逐步引导我们自己去查找文献,开展同行之间的讨论,再系统而有逻辑地去阐述论证”。

如今培养博士生,谭光明在告诉年轻人一定要想清楚是否具备极强的毅力和心理承受力之外,也在继承着孙凝晖院士的教学传统,注重培养学生的独立思考能力和严谨的科研态度。

提到高性能计算机的研究之路,谭光明说,是攻克一个个难题之后的契合与满足。“解决当中的问题和我的性格还是很匹配的,我有兴致、有动力去思考、去解决那些难题。”

“高性能计算机可以说是一门交叉学科,从过去专注于数值模拟类,发展成为非常关注解决国计民生等诸多实际问题的一门学科。很多研究都离不开高性能计算机技术的支持,我觉得这是值得一辈子耕耘下去的方向。”

谭光明读博士期间的第一个项目即研究高性能计算机在生命科学领域的运用,为人类基因组的分析、病毒演化的分析提供研究支持。

读博最后的一年时光,谭光明由于出色的科研能力,获得了赴美国特拉华大学开展科研的机会。这期间,美国特拉华大学电子与计算机工程学院终身教授、世界著名计算机科学家高光荣的学术态度、学者风范也给谭光明留下了深刻的印象。

虽然,这位学术大家已经功成名就,但依然葆有着旺盛的科研热情,每个周末都会主动和谭光明等学生约时间进行讨论,“实验室也是这位老教授最常待的地方,科研对他来说就是一种习惯,离不开。我也很受鼓舞”。

在美国一年的科研时光在充实中划过,谭光明也在高性能计算机方面的加速引擎架构研究中颇有所获。他的博士论文获得中国计算机学会优秀博士论文奖,也为之后开展曙光系列的科研攻关奠定了坚实基础。


向更高处攀登

博士毕业后,谭光明开始深度参与到“曙光6000千万亿次高效能计算机系统”(曙光6000)的研究。最初,整个系统的性能并不理想,距离项目目标还有很长的路要走。

进入2009年之后,谭光明和团队成员开始了长达一年的密集封闭式攻关。

为了寻找到最优解,谭光明和团队讨论的技术图纸随着大家的思绪翻飞,一张张纸上落满了各类的符号图样。终于,思路和灵感从层层图纸之中破茧而生!谭光明推出的数据渗透优化技术,不仅保障了整体系统的有效运转,在速度、性能方面达到世界最优。

与谭光明一同攻关的一位“战友”颇为兴奋道:“多亏谭博士每天不停地画圈圈,终于把问题解决了!”

组装调试阶段,谭光明和团队来到天津一处还没有完工的工作厂房,进行最后的调试、优化。旷野耕地的风、机器运转的轰鸣声仿佛还在耳边,熬夜通宵也是家常便饭。在高性能计算机研究团队的刻苦求索中,我国超算领域自主研发的羽翼振翅而动。

2011年,数据渗透优化技术的研究成果在业界顶级会议——全球超级计算大会(SC)上发表,该技术使曙光6000成为国内首次实测峰值性能突破千万亿次的系统,该成果获国家科技进步二等奖。

与此同时,谭光明带领一名博士生已经开始了机器学习方面的技术研究,实现了同期性能最高的算法库,并发表在国际顶级会议PLDI上。

论文发表两年后的2015年,Intel公司才基于类似的优化策略,运用到数据库的开发之中。

研究曙光7000系统时,谭光明的团队再度面临着前所未有的挑战。相比于国外硬件基础的完备,由于经费有限,国产硬件参数方面并不理想,需要通过其他系统层面、软件方面的配合和优化,在弥补硬件固有不足的基础上,实现最快、最好的性能,这无异于登顶珠峰。

为了弥合理论预测与实际运行之间的差距,团队花费了大量的时间从硬件结构、底层系统、运行环境、数学库优化等逐一优化,才使得整个运行链条高效运转。曾经一度,科研人员调侃,“我们需要一个超人”。最终,得益于谭光明与核心骨干在高性能计算机研究领域长久的积累与实践,他提出了新的模型和算法,刷新了超算领域的运算速度。

当然,谭光明研究攻克的难题远不止如此。多线程高速并行的不仅仅有复杂且精密的超算系统,还有团队中每个人艰苦卓绝的不懈探索和日复一日甘于寂寞的努力。而也正是得益于他们的研究,我国的科研实力,尤其在超算领域不断取得新的突破,逐步缩小了与国外先进研制水平的差距,并在整机系统设计和关键技术实现领先。

曙光6000和曙光7000研制中的关键技术等等这些听起来艰涩难懂的研究成果,已为诸如“地球系统数值模拟装置”、“多模态跨尺度生物医学成像设施”、中国“天眼”(FAST)等国家重大科技基础设施提供重要的算力支持。

依托于高性能计算机的相关技术,曙光团队为“地球系统数值模拟装置”建设项目提供了定制类运算系统,为我国防灾减灾、应对气候变化、大气环境治理等重大问题提供科学支撑。

具体来说,比如我国可以通过高性能计算机技术,准确评估全球历史时期以及未来的气候变化、温室气体的排放,以此为基础提高中国应对气候变化和碳减排的国际话语权。

而高性能计算机技术除了在国家战略发展领域发挥作用的同时,也距大众的生活越来越近。据介绍,中科院计算技术研究所孵化的人工智能企业——哲源科技,在应用数学、工程学、计算科学等技术的支持下,将生命变得可数据化。而人体健康管理、药企新药研发等方方面面都离不开超算支持。

目前,谭光明正在带领团队向着新一代更高性能、更快的计算机研究进发。登高望远,未有穷期。在高性能计算机这项“马拉松式攀登珠峰”的道路上,他们在一次次绝地求生中,迎向曙光。

【本文刊于《中华儿女》杂志第10期】

相关文章