當(dāng)下,以ChatGPT為代表的人工智能大模型技術(shù)發(fā)展迅猛,正以雷霆之勢(shì)席卷各個(gè)行業(yè)。國內(nèi)越來越多的企業(yè)紛紛布局AI大模型的全新賽道,引發(fā)了新一輪人工智能新技術(shù)熱潮,驅(qū)動(dòng)算力需求的爆炸式增長。
國內(nèi)某互聯(lián)網(wǎng)企業(yè),始終以用戶為中心,不斷加大在新技術(shù)上的研發(fā)投入,持續(xù)推動(dòng)服務(wù)零售和商品零售在需求側(cè)和供給側(cè)的數(shù)字化升級(jí),致力于為用戶提供品質(zhì)服務(wù)。
為了促進(jìn)自身業(yè)務(wù)發(fā)展和提升用戶體驗(yàn),該企業(yè)也向大模型領(lǐng)域發(fā)起進(jìn)軍,希望通過大模型數(shù)據(jù)訓(xùn)練和算法,實(shí)現(xiàn)產(chǎn)品應(yīng)用的轉(zhuǎn)型和升級(jí),以提高品牌滿意度。然而,要實(shí)現(xiàn)這一目標(biāo),強(qiáng)大的算力是必不可少的。
算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),沒有算力,做大模型就是天方夜譚。大模型需要處理海量的數(shù)據(jù),并且需要在短時(shí)間內(nèi)完成復(fù)雜的計(jì)算任務(wù),這就要求更高水平的計(jì)算能力。因此,該客戶迫切需要一款能滿足大模型訓(xùn)練高性能計(jì)算需求的AI算力基礎(chǔ)設(shè)施,為海量數(shù)據(jù)的大規(guī)模訓(xùn)練提供強(qiáng)大算力支撐。
在了解到客戶的需求之后,寶德量身推薦了一款擁有高強(qiáng)的計(jì)算能力的寶德AI訓(xùn)練服務(wù)器PR4910E。其配備了最先進(jìn)的硬件設(shè)施,包括高效的CPU、GPU和TPU等,可以提供強(qiáng)大的計(jì)算能力來支持復(fù)雜的AI模型訓(xùn)練,為該企業(yè)夯實(shí)了AI大模型算力底座。
它采用2顆身懷七大算力神器的第四代英特爾?至強(qiáng)?可擴(kuò)展處理器,最大可達(dá)60核心,并具有13 個(gè)PCIe x16 Gen5插槽,支持10個(gè)全高全長雙寬 GPU卡(NVIDIA? Tesla系列、英特爾?GPU Flex系列和昇騰Atlas系列等),可為大模型訓(xùn)練強(qiáng)有力的算力支撐;它支持32個(gè) DIMM / DDR5內(nèi)存插槽,支持最新400Gb ETH和NDR IB高速智能網(wǎng)卡,以及 GPU Direct RDMA,最多支持24個(gè) NVMe SSD,且采用CPU 直通設(shè)計(jì),大幅降低 I/O 延遲,這些都為大模型數(shù)據(jù)存儲(chǔ)和傳輸提供高效可靠保證。
此外,它采用整機(jī)模塊化設(shè)計(jì),支持靈活切換 CPU 和 GPU/TPU 的異構(gòu)拓?fù)浣Y(jié)構(gòu),讓算力發(fā)揮到極致,為各個(gè)場景下的AI應(yīng)用加速提碼,方便用戶維護(hù)和管理。
“截至目前,寶德AI服務(wù)器一直穩(wěn)定運(yùn)行,為我們的AI大模型開發(fā)訓(xùn)練夯實(shí)了算力底座。得益于寶德AI服務(wù)器的強(qiáng)大算力支持,我們?nèi)〉昧穗A段性的進(jìn)展,同時(shí)AI技術(shù)得到不斷精進(jìn),為大模型沉淀了數(shù)據(jù)資產(chǎn)和場景資產(chǎn)。這些資產(chǎn)都是根植于平臺(tái)系統(tǒng)之內(nèi)的,更符合我們大模型未來的應(yīng)用場景?!笨蛻舴Q贊道。