军中有支超算“战队”

发布时间:2024-12-05 19:46:15 来源: sp20241205

  ◎本报记者 张 强

  通 讯 员 陈 思 颜 瑾 何智明

  近日,由国防科技大学计算机学院为国家超算广州中心研制的新一代国产超级计算系统——“天河星逸”发布。“天河星逸”系统以应用为中心,在通用CPU计算能力、存储能力以及应用服务能力等多方面较“天河二号”实现倍增。

  科技日报记者了解到,1993年,该学院被中央军委授予“科技攻关先锋”荣誉称号,至今已30余年。30多年前,这支团队创造出“银河-Ⅱ”巨型计算机系统。如今,“天河”新一代超级计算机系统已经启动运行。

  从研究小组到国家“战队”,从打破垄断到世界第一……国防科技大学计算机学院这支军中劲旅始终把服务重大战略需求作为崇高使命,为国家创造了一个又一个超算奇迹。

  六连冠花落“天河”

  2010年11月14日,国际TOP500组织在网站上公布了最新全球超级计算机前500强排行榜,中国千万亿次超级计算机系统“天河一号”雄居第一。

  在“天河一号”首次登上世界超算之巅的那一刻,国防科技大学计算机学院天河团队骄傲地举起刻有“中国制造”的金色奖牌。“天河一号”总设计师杨学军激动地说:“我们做了一件让自己满意的事,一件让中国人扬眉吐气的事!”

  科研创新是孤独的苦旅。他们步履匆匆,目光始终瞄准世界最前沿。

  “我们要走别人没有走过的路。”杨学军说。为完成“天河一号”,他带领团队在世界上率先采用CPU+GPU异构融合体系。团队的一名骨干教授负责更好地发挥GPU性能。为了提升GPU的计算效率,这位教授对市场上20多种型号的GPU进行安装测试,仅试型号就耗费了3个月。每天进行100多次实验,连续进行4个月,在8万余次优化改进后,他终于将GPU的计算效率从国际公认的20%提高到70%,让这条独创的技术路线一跃成为国际主流。

  虽然荣膺世界第一,但团队无暇庆功。他们首先开了一个“醒脑会”,将目光投向未来,投向与世界超算强国的新战役。

  2011年6月,“天河一号”被挤下榜首,外界有评论称“天河一号”的成功不过是昙花一现。这些声音并未让团队成员们气馁。他们保持沉默,继续攻坚克难。2013年6月,“天河二号”超级计算机系统再摘世界桂冠。随后,团队不断刷新世界超算纪录,拿下世界排名“六连冠”,一次次向世界证明着中国实力。

  “假如人生能实现一个梦,我的梦,就是让中国在世界高性能计算机领域拥有一席之地。”这是“中国巨型计算机之父”慈云桂生前所言。时光荏苒,30余年过去,慈云桂的梦想仍然深深烙在每位团队成员的心中。

  “要干就干一流的”

  国防科技大学计算机学院某重点实验室有个11人的科研团队。正是这支人数“迷你”的团队,在国际上率先开启量子计算“称霸标准”研究,并研发了新型光量子计算芯片,成功主持研制国际首台面向图论问题的光量子计算系统。

  这个团队名为“QUANTA”,意为“一群来自IT领域的量子的粉丝”。“量子计算是未来趋势,是超算的一条新技术路线。无论多么困难,学院都会支持我们走下去。”该团队负责人说。

  “这山望着那山高”,似乎是从事超算的科学家们共同的“调性”。

  这个“调”是慈云桂定下来的。他提出研发巨型计算机时,我国正值动荡岁月,每秒百万次中心处理机还在图纸阶段,但他却认为:“我们不仅要吃着碗里的,看着锅里的,还要想着米缸里的。现在,那些远远走在我们前面的国家,还在你追我赶,相互竞争。如果我们的目光只盯着脚趾前的一小块地方,那么在世界计算机领域里,将永远没有我们中国人的一席之地!”

  从百万次一跃到亿次,需要跨越多少技术鸿沟?国防科技大学计算机学院院史馆内展示了我国自行设计和研制的第一台每秒运算速度达亿次的巨型计算机——“银河-I”的内部构造。这台巨型计算机内密密麻麻的布线让人眼花缭乱。记者发现,这些布线竟然都是手工制作——全机底板2.5万条绕接线、12万个绕接点无一错漏;800多块多层印刷板上、每块板上平均5000个金属化孔全部通过测试;200多万个焊点无一虚焊。

  1986年,在“银河-Ⅱ”巨型计算机设计阶段,总师周兴铭曾突然叫停大家干了大半年的单机处理方案,提出双处理机系统方案。但方案刚敲定,周兴铭却发现一家公司已经在尝试研发四处理机系统技术了。于是他当机立断,决定研制四处理机系统。“这么变来变去,要变到何时?”面对质疑,周兴铭力排众议。他说:“要干就干一流的,这是我们‘银河人’的传统。”

  4年后,“银河-Ⅱ”研制成功,速度比合同规定指标快了近3倍,再次打破了国外在巨型机领域对中国的封锁。

  在“银河-Ⅲ”巨型计算机的研制过程中, 大规模并行处理技术(MPP)路线刚刚出现,这一前沿技术研制难、应用难,让许多大公司都栽了跟头。总师杨学军决定:“为了实现更大突破,挑战MPP路线!”最终,团队成功攻克MPP路线难题,让“银河-Ⅲ”的速度相比“银河-Ⅱ”提高了10倍,体积却缩小了6倍。

  “银河精神”历久弥新

  大任务需要体系设计,团队作战向来是国防科技大学计算机学院的传统。参研过多代“银河”系统的一位科研人员回忆道,在“银河-Ⅱ”团队中,有从全军抽调的战士,有“哈军工”来的老师,也有刚毕业的学生……总师除了要下沉到基层解决问题,还要把每位同志安排到最合适的岗位。

  “每个人的工作都在‘银河’大系统里运转,千万根线,错一根,都不行。”这位科研人员说,这支多元化的队伍完成了各种任务和系统设计,并不断更新、完善机器性能。

  “我们首先是军人。只要国家需要,我们都会义无反顾。”团队的另一位科研人员说。

  计算机学院前坪那片以“银河”命名的宽阔广场,见证了团队夺冠的辉煌,更见证了无数个日夜团队在寂寞中坚守的时光。

  2020年底至2021年,团队成员在这片广场召开了一场又一场的露天例会。

  参与会议的科研参谋还留存着第一次露天开会的照片。空旷无人的校园广场中,他们的头发被风吹得乱糟糟,耳朵冻得红通通,但眼神都亮晶晶。凛冽的寒风和胸中滚烫的使命感,共同构成了这幅动人的画面。

  30年来,“胸怀祖国、团结协作、志在高峰、奋勇拼搏”的“银河精神”从未因岁月而失色,反而在时间的洗礼中历久弥新。 【编辑:房家梁】