近日,浪潮信息推出了一款專為萬億參數級大模型打造的超節點 AI 服務器「元腦 SD200」。這款新產品的亮相,不僅彰顯了浪潮信息在前沿計算架構領域的扎實功底,也意味著國產算力系統在應對超大規模 AI 模型挑戰時,邁入了一個全新的發展階段。下面,我們就來詳細了解一下這款服務器。
?
一、單機承載萬億級模型,架構實現突破?
如今,大模型參數規模不斷攀升,像 DeepSeek R1、Kimi K2、Qwen 等開源模型都已接近或突破萬億參數。面對這樣的趨勢,傳統服務器在顯存和帶寬方面的瓶頸愈發明顯。而浪潮信息的「元腦 SD200」采用超節點架構,對算力邏輯進行了重構,在單機內集成了 64 路本土 GPU 芯片,讓傳統服務器集群的性能瓶頸成為過去。?
在存儲方面,借助遠端 GPU 虛擬映射技術,服務器的顯存統一地址空間擴大了 8 倍,單機能提供最大 4TB 的統一顯存和 64TB 的統一內存。這就為萬億參數模型處理海量鍵值緩存和超長序列提供了充足的資源。實際測試顯示,它能同時運行 DeepSeek R1、Qwen、Kimi、GLM 這四大國產頂級開源模型,滿足多智能體實時協作和按需調用等復雜場景的需求。?
通信方面,通過自研的 Open Fabric Switch 開放總線交換技術構建起 3D Mesh 系統架構,實現了 64 卡 GPU 的高速互連。憑借百納秒級的物理鏈路和原生內存語義通信,在推理時的小數據包通信場景中,比如原子操作、load - store 指令等,性能有了明顯提升。全規約等算子的通信效率也遠超傳統架構,有效解決了大規模并行計算中數據傳輸的難題。
?
二、軟硬協同發力,突破芯片性能極限?
「元腦 SD200」不只是簡單的硬件組合,更是系統層面上軟硬深度協同的成果。?
智能總線管理系統能夠根據萬億模型計算時對通信的敏感需求,動態規劃出全局最優的路由,支持多拓撲結構的切換和資源的按需分配。對于 All Reduce、All Gather 等常見算子,通過多層級細粒度的通信策略,進一步降低延遲,讓 64 卡 GPU 的協同潛力得到最大程度的發揮。?
開放 PD 分離推理框架將推理過程拆分為預填充與解碼異步并行,提高了 KV Cache 的傳輸效率。這不僅提升了業務場景的服務等級,還能很好地兼容昇騰、沐曦等國產 GPU 及異構計算組合,大大增強了系統對未來模型更新迭代的適應能力。?
和傳統的橫向擴展方案相比,SD200 選擇了縱向擴展路徑。這種設計通過短鏈路物理集成,讓芯片間的通信效率有了質的飛躍。浪潮信息副總經理趙帥表示,在推理場景的小數據包通信優化上,這種設計效果顯著。實際測試中,DeepSeek R1 全參推理性能實現了 370% 的超線性擴展效率,Kimi K2 等模型的性能也有明顯提升。
?
三、秉持開放生態理念,助力國產 AI 規模化應用?
浪潮信息一直將開源開放作為核心戰略,「元腦 SD200」就是這一理念的生動體現。?
在本土產業鏈協同與兼容方面,服務器采用 OCM(開放算力模組)+ OAM(開放加速模塊)標準架構設計,能夠快速適配 Intel、AMD、ARM 等多種 CPU 平臺,以及摩爾線程、沐曦、天數智芯等 20 余家主流國產 GPU 芯片。通過標準化,降低了產業鏈整合的成本,推動了國產算力生態的成熟。?
在部署遷移方面,它全面兼容 PyTorch、vLLM、SGLang 等主流 AI 框架,以及 Megatron - LM、DeepSpeed 等訓練工具,現有模型和工作流可以零改造遷移過來。這對生物醫藥、氣象科學、工業仿真等垂直領域的客戶來說非常重要,他們能快速將定制化的萬億模型部署到新平臺上,加快 AI 在科學等前沿領域的應用。?
同時,浪潮信息還通過「元腦生態」平臺不斷開放技術接口,與華勝天成、上海華胄等行業 ISV 伙伴深度合作,共同開發場景化解決方案,推動 AI 從通用能力向各個行業的智能化深度發展。
?
四、破解算力難題,改變 AI 應用模式?
當前,AI 產業正受到模型參數膨脹和 Agentic 智能體交互的雙重推動。?
萬億模型的商業化迎來了關鍵轉折點。麥肯錫預測,未來五年全球 AI 數據中心的算力需求將大幅增長,電力增量相當于 10 個三峽電站的年發電量。傳統的單點服務器或小規模集群已經難以滿足智能體應用的需求,這類應用推理速度需要達到 50–100 token/s,多輪對話的 token 量更是傳統模型的百倍。「元腦 SD200」的全面商用,為企業提供了一條降本增效的規模化部署途徑,單機就能替代部分低效集群,降低數據中心的復雜度和運維成本。?
在綠色可持續方面,SD200 優先采用風冷方案,同時也兼顧液冷擴展。這不僅降低了企業機房改造的門檻,還順應了全球數據中心能效優化的趨勢,體現了浪潮信息長期堅持的「綠色計算」理念。
?
五、前瞻布局,引領國產算力進入超節點時代?
「元腦 SD200」的誕生并非偶然,而是浪潮信息在融合架構與開放計算領域十余年積累的成果。?
其核心技術,如內存語義通信、資源池化、動態調度等,源于浪潮信息對「融合架構 3.0」的不斷發展。從整合供電、散熱等非 IT 資源,到實現計算、存儲、異構加速等核心資源的深度解耦,積累了芯片共享內存、統一編址等關鍵能力。此前發布的「源 1.0」中文巨量模型(2457 億參數)以及多款 CPU 推理服務器(如 NF8260G7),都為大模型優化積累了豐富經驗。?
作為開放計算社區(OCP)與中國開放計算標準組織(OCTC)的重要成員,浪潮信息正積極推動超節點架構的標準化。后續計劃開源部分設計及 PD 分離框架,聯合產學研伙伴共同構建 GW 級開放智算生態,助力中國在全球 AI 算力競爭中占據有利地位。