GPU服務(wù)器和通用服務(wù)器是目前服務(wù)器市場根據(jù)業(yè)務(wù)場景進(jìn)行的細(xì)分,并沒有嚴(yán)格意義上的定位,你可以理解為GPU服務(wù)器是通用服務(wù)器為了更好支持GPU進(jìn)行的優(yōu)化設(shè)計(jì)。
一、GPU卡支持的數(shù)量不同
1、GPU服務(wù)器通常在GPU卡的支持上至少4張起,市場主流的有4卡、8卡、10卡、20卡等,這里的卡指的是標(biāo)準(zhǔn)雙寬卡,以下是國內(nèi)某大廠GPU服務(wù)器的后視圖,供參考。
2、通用服務(wù)器:一般2U的不超過4卡,4U的不超過6卡,也是指的標(biāo)準(zhǔn)雙寬卡。
二、GPU卡支持類型不同
1、GPU服務(wù)器:對卡的兼容性很好,除了單寬、雙寬,部分廠商的機(jī)型還能支持消費(fèi)類的2.5或3寬游戲卡,比如四通推出的G5208支持8卡的風(fēng)扇版4090,就是比較創(chuàng)新的一款機(jī)器,其GPU支持參數(shù)和結(jié)構(gòu)圖如下。
三、機(jī)器形態(tài)不同:
1、GPU服務(wù)器:通常都是單節(jié)點(diǎn)形態(tài),市場上以4U為主,還有機(jī)塔互轉(zhuǎn)形態(tài),也有高 端的NVlink機(jī)型是5U、6U或8U;
2、通用服務(wù)器:通常是2U的形態(tài),也有1U高度,高密的2U2、2U4、4U8、刀片或者整機(jī)柜,產(chǎn)品形態(tài)更豐富;
四、GPU與CPU拓?fù)洳煌?/strong>
1、GPU服務(wù)器:除了PCIE直通還可以通通過PCIE sw進(jìn)行擴(kuò)展,拓?fù)漕愋投鄻?,有balance、common和cascade,針對不同的客戶業(yè)務(wù)場景(訓(xùn)練、推理、視頻渲染等)可以更加靈活的選擇,具體如下圖。
2、通用服務(wù)器:通常是PCIE直通(通過PCIe sw的很少見),而且支持的GPU數(shù)量有限;
五、服務(wù)器的品牌不同:
1、GPU服務(wù)器:除了頭部大廠是自己研發(fā)的平臺(LC、H3C、C J B、LX等等),其他大多數(shù)用的超微的平臺(當(dāng)然不排除其他的ODM廠家,比如HQ、HS等)。
2、通用服務(wù)器:叫上名字的有大幾十家,除了頭部幾家自研程度高以外,一般都是以攢機(jī)為主(實(shí)事求是講,不接受反駁),主打性價(jià)比;
六、整機(jī)功耗差距很大:
1、GPU服務(wù)器:功耗偏高,以4090八卡機(jī)為例,一臺服務(wù)器要4KW以上,比如市場主流的超微8卡平臺,通常就是2+2的2KW電源(當(dāng)然也可以設(shè)置為3+1的工作模式);
2、通用服務(wù)器:低配的一般為500-550w,還有800W、100W、1200W和1600W,通常超過2KW的不多;
七、單臺服務(wù)器價(jià)格不同:
1、GPU服務(wù)器:平臺就是通用服務(wù)器的2-3倍,實(shí)際出貨一臺輕松過十萬,大幾十萬到上百萬也是正常,這個(gè)主要是取決于GPU卡的價(jià)格,比如8卡A100,平臺的成本占比就很小了。
2、通用服務(wù)器:價(jià)格范圍就很大,1-2w到幾十萬不等,但是以10W以下需求居多,均價(jià)大概3-5w一臺,這也是為什么現(xiàn)在大家都喜歡賣GPU服務(wù)器的原因,一臺頂十臺,出幾十臺臺4090八卡機(jī),銷售的業(yè)績?nèi)蝿?wù)基本上就達(dá)成了。
八、整體的市場份額不同:
時(shí)間往前倒退2年,整個(gè)服務(wù)器市場規(guī)模,GPU服務(wù)器占比約為20-25%,而標(biāo)準(zhǔn)的服務(wù)器占比高達(dá)70%以上,現(xiàn)在GPU市場火爆,尤其是AIDC的建設(shè),粗略估算GPU類的機(jī)型出貨已經(jīng)超過3或4成(如下圖,是IDC統(tǒng)計(jì)的23年國內(nèi)加速服務(wù)器市場的市占比超過了30%)。
九、服務(wù)器的業(yè)務(wù)場景定位不同:
GPU服務(wù)器一般是視頻渲染圖形處理、做AI訓(xùn)練、AI推理或者HPC計(jì)算為主,而標(biāo)準(zhǔn)服務(wù)器哪里都可以用,比如做私有云、分布式存儲、管理節(jié)點(diǎn)、HPC通用算力節(jié)點(diǎn)等等。
十、液冷技術(shù)需求的迫切性不同:
GPU服務(wù)器都是“電老虎”,也是智算中心降低PUE指標(biāo)的關(guān)鍵,因此目前很多在建或者準(zhǔn)備建設(shè)的智算中心都規(guī)劃了GPU服務(wù)器的液冷(冷板和浸沒式的都有),但是風(fēng)險(xiǎn)點(diǎn)是GPU卡的保修,一旦對GPU卡進(jìn)行液冷改造的手術(shù),一般會(huì)影響原廠的質(zhì)保(當(dāng)然這個(gè)問題是暫時(shí)的,不排除后面GPU廠商推出專門的液冷型號,其實(shí)2年前英偉達(dá)就推出過一款A(yù)100單寬的液冷GPU,見下圖),通用服務(wù)器在液冷維度迫切性不如GPU服務(wù)器(但是通用服務(wù)器結(jié)構(gòu)相對簡單在液冷冷板改造還是浸沒式適配方面要比GPU服務(wù)器更加成熟);
來源: IT技術(shù)分享-老張 公眾號