IT之家 3 月 17 日消息,儘管美國宇航局 (NASA) 一直使用着世界上最前沿的技術,並取得了人類歷史上許多重大發現,但一份其內部總監察長辦公室 (NASA Office of Inspector General) 的特別報告卻揭露,由於 NASA 的超級計算機能力不足以滿足任務需求,導致一些項目進度延誤。

報告指出,NASA 的超級計算機仍然主要依賴於 CPU 中央處理器,例如其旗艦超級計算機之一,竟擁有 18000 個 CPU,但僅有 48 個 GPU 圖形處理器。要知道,GPU 在並行處理任務(科學模擬和建模中非常常見)方面能提供遠超 CPU 的計算能力。

目前,NASA 在加州埃姆斯研究中心 (Ames) 的 NASA 先進超級計算中心 (NAS) 和馬里蘭州戈達德太空中心 (Goddard) 的 NASA 氣候模擬中心 (NCCS) 共擁有五臺高端計算 (HEC) 設備。這些設備包括支持重返月球並建立長期駐留基地“阿爾忒彌斯計劃”的艾特肯 (Aitken)、性能強大的伊萊克特拉 (Electra)、用於氣候和天氣模擬的發現號 (Discover)、應用於氣候模擬、天體物理研究和航空航天建模的畢宿五 (Pleiades) 以及奮進號 (Endeavour)。

IT之家注意到,這些機器幾乎完全依賴舊款的 CPU 核心,例如,所有 NAS 超級計算機都使用超過 18000 個 CPU,而 GPU 僅有 48 個,NCCS 的 GPU 數量甚至更少。

報告援引美國宇航局高端計算官員的話說,造成系統無法現代化的原因是多方面的,包括供應鏈問題、現代編程語言需求以及實施新技術所需的技術人員短缺等。報告指出,無法升級現有高端計算基礎設施將直接影響美國宇航局實現其探索、科學和研究目標的能力。

審計還發現,美國宇航局的高端計算運營並未進行集中管理,導致效率低下,並且缺乏內部資源與雲計算資源之間使用策略的統一性。由於未知的調度方式或假定的更高成本,這種不確定性導致了對使用雲計算資源的猶豫。一些任務被迫自行獲取基礎設施,以避免等待使用主要超級計算資源,因爲這些資源在很大程度上由於沒有采用最新的高性能計算技術而導致過載。

此外,審計發現,高端計算基礎設施的安全控制措施經常被繞過或未被實施,從而增加了網絡攻擊的風險。

報告最後建議,轉向使用 GPU 和進行代碼現代化改造是滿足 NASA 當前和未來需求的關鍵。這將大大提升其在科學模擬和建模等領域的計算能力,並助力其順利完成各項太空探索和科研任務。

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超鏈接、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章