更開放,更懂AI,新華三發(fā)布多元異構(gòu)算力平臺
紫光股份旗下新華三集團發(fā)布全新多元異構(gòu)算力平臺H3C UniServer R5330 G7和H3C UniServer R5500 G7服務(wù)器,以多元異構(gòu)、開放包容、靈活等多重優(yōu)勢,提供高性能、高可靠的多元算力,為不同AI負載提供強勁算力支撐,為數(shù)字經(jīng)濟高質(zhì)量發(fā)展提供堅實后盾。
智能算力 H3C UniServer R5500 G7服務(wù)器
為AI而生 模塊化設(shè)計打造及至算力
“百模大戰(zhàn)”熱潮下,大模型的訓練及推理過程均需要強大的算力作為支撐。H3C UniServer R5500 G7服務(wù)器是專為AI大模型訓練而設(shè)計的智能算力旗艦新品,支持千億級參數(shù)規(guī)模的大模型訓練。產(chǎn)品采用系統(tǒng)解耦的模塊化設(shè)計,兼容新OCP OAI開放硬件標準,實現(xiàn)算力開放和可進化;通過搭載2顆新處理器以及新一代OAM 8-GPU模組,為AI大模型訓練提供算力與互聯(lián)帶寬,加速AGI時代到來。算力旗 艦,助力AI大模型訓練:
-
支持超過15種、千億級參數(shù)主流大模型訓練,覆蓋AIGC、計算機視覺、自然語言處理和大數(shù)據(jù)分析等多種AI應(yīng)用場景。
-
采用模塊化設(shè)計,用戶可靈活選擇GPU計算模塊,提高系統(tǒng)的可擴展性和可維護性,節(jié)省成本。
-
GPU模組算力可提升200%,Llama2-70B增量預(yù)訓練僅需15天。
生態(tài)兼容,AI業(yè)務(wù)平滑遷移:
-
主流開源大模型一鍵遷移,客戶模型零代碼改動。
-
CUDA底層原生兼容,算子庫兼容可達95%以上。
-
適配國內(nèi)外主流深度學習框架,原生適配國產(chǎn)飛槳深度學習框架。
可靠,算力管理智能靈活:
-
CPU、GPU模組、BMC芯片等核心部件支持國產(chǎn)化,供應(yīng)可靠。
-
結(jié)合傲飛算力平臺,可實現(xiàn)萬卡集群算力統(tǒng)一調(diào)度,算力高 效率使用。
-
算力資源統(tǒng)一管理、監(jiān)控、告警,智能靈活。
自主算力引擎H3C UniServer R5330 G7服務(wù)器
直面異構(gòu)算力 性能助力AGI時代
隨著多元異構(gòu)算力的廣泛應(yīng)用,伴隨而來的諸多挑戰(zhàn)也逐漸浮現(xiàn)。由于不同廠商硬件存在計算架構(gòu)、緩存資源、互聯(lián)方式等差異,限制了算力資源的充分使用和靈活調(diào)度。新華三集團發(fā)布的自主算力引擎產(chǎn)品——H3C UniServer R5330 G7服務(wù)器,搭載2顆新處理器+GPU異構(gòu)算力,可解決異構(gòu)算力部署的技術(shù)難題;CUDA算子庫支持95%以上,讓底層適配更加便捷,實現(xiàn)生態(tài)無縫遷移;開放包容,異構(gòu)賦能,為不同AI負載提供強勁算力支撐。訓推一體,AI開發(fā)新范式:
-
對比上一代GPU,大模型訓練場景下的AI算力提升超過30%,顯存容量提升100。
-
大模型推理場景僅需單臺8-GPU便可支持在100用戶同時訪問情況下達到15 token/s,提供更快的服務(wù)響應(yīng)速度。
-
支持多元GPU異構(gòu)算力大模型混合部署,更具靈活性,為用戶提供更多選擇。
生態(tài)開放,AI業(yè)務(wù)快速部署:
-
CUDA算子庫支持95%以上,用戶代碼零改動。
-
支持200種以上主流AI模型,軟件棧兼容國內(nèi)外主流生態(tài),支持原生社區(qū)分布式訓練方案。
-
覆蓋通用計算、FFT(快速傅里葉變換)等多種計算模式。
異構(gòu)賦能,實現(xiàn)智能算力調(diào)度:
-
結(jié)合傲飛算力平臺,可實現(xiàn)萬卡集群算力統(tǒng)一調(diào)度。
-
提供模型訓練、微調(diào)、評估、推理全流程服務(wù)。
-
支持AI算力資源統(tǒng)一管理、監(jiān)控、告警,讓運維更智能、更靈活。