全球首个亿级参数量地震波大模型“谛听”发布

发布时间:2024-11-21 20:13:07 来源: sp20241121

  科技日报成都7月30日电 (刘侠 记者 滕继濮 实习生 吴晓静)记者30日获悉,“谛听”地震波大模型日前在国家超级计算成都中心发布,将于2024年底公测。据介绍,这是全球首个亿级参数量的专业地震数据处理大模型。

  2023年9月,由成都产业集团、成都天投集团联合运营的国家超级计算成都中心,与中国地震局地球物理研究所共建“地震大模型创新应用联合实验室”。随后,中心与清华大学、中国科学院地质与地球物理研究所的研究团队一同合作,启动“谛听”地震波大模型的训练。同时,大模型依托的“谛听”地震学数据集也落户该实验室。此数据集是国内首个,同时也是目前全球最大规模、最多样本类型、标注最为全面的地震学专业AI训练数据集之一。

  成都数据集团党委副书记、超算运营公司董事长郭黎表示,“谛听”系列地震波大模型已有阶段性成果,目前已成为全球第一个亿级参数量的地震波大模型并具备投入使用的条件。同时,十亿参数量级的版本预计2024年8月完成预训练,将进一步为新时代防震减灾事业现代化提供科技支撑。

  “谛听”如何为防震减灾事业现代化提供科技支撑?

  “‘谛听’大模型依托中国地震观测网的海量数据,通过人工智能技术,已显著提升地震信号识别的准确率和速度。”中国地震局地球物理研究所副所长陈石认为,长期来看,地震学是一门观测科学,重大的突破往往来自对观测数据的深刻理解。目前,传统方法和中小模型均无法充分利用千、万TB(百万兆字节)级别的地震观测数据,而这些数据蕴含许多重要的地震学问题,只有大模型才能深入挖掘这些“宝藏”。短期来看,“谛听”地震波大模型将应用于地震信号识别、地震活动监测、大地震快速响应等领域。

  “‘谛听’地震波大模型的发布对于突破中小地震波模型性能瓶颈、提高地震大数据智能处理能力和信息挖掘水平具有重要意义。”国家超级计算成都中心常务副主任王建波表示,中心的算力支持是“谛听”地震波大模型得以开发的基础,相比过去的地震波小模型,“谛听”大模型的训练数据量和参数量都增加了两个量级以上,因此对算力的需求也呈现大幅增长。为此,中心采用国内先进技术为大模型开发提供支撑,同时在研发过程中为科研团队的代码运行效率优化提供了关键技术支持,使得“谛听”的研发过程更加顺畅高效。未来,该模型的应用场景还有望延伸到矿震监测、页岩气开采、城市地下空间结构探测、海底地震监测等多个领域。 【编辑:房家梁】