生成式AI的爆發(fā)式發(fā)展正在重塑應(yīng)用生態(tài),并對(duì)算力基礎(chǔ)設(shè)施提出全新挑戰(zhàn)。進(jìn)入2025年,DeepSeek的橫空出世加速了這一變革進(jìn)程,同時(shí)也進(jìn)一步凸顯了算力基礎(chǔ)設(shè)施面臨的挑戰(zhàn)。為助力企業(yè)應(yīng)對(duì)新的挑戰(zhàn),基礎(chǔ)設(shè)施相關(guān)產(chǎn)品和技術(shù)加快了迭代速度。
在5月7日舉行的2025聯(lián)想創(chuàng)新技術(shù)大會(huì)上,聯(lián)想圍繞基礎(chǔ)設(shè)施宣布了六項(xiàng)創(chuàng)新技術(shù)(包括AI推理加速算法集、AI編譯優(yōu)化器、AI訓(xùn)推慢節(jié)點(diǎn)故障預(yù)測與自愈系統(tǒng)、專家并行通信算法、“飛魚”仿生散熱設(shè)計(jì)與浸沒式制冷系統(tǒng)、算力服務(wù)“成本-效能”雙優(yōu)運(yùn)營系統(tǒng))以及兩大重磅升級(jí)(聯(lián)想萬全異構(gòu)智算平臺(tái)3.0、算力基礎(chǔ)設(shè)施),直指當(dāng)前用戶在落地AI應(yīng)用時(shí)最為關(guān)切的痛點(diǎn),旨在幫助用戶升級(jí)基礎(chǔ)設(shè)施,早日實(shí)現(xiàn)AI算力賦能業(yè)務(wù)。
01
助力人工智能快速落地,加速AI價(jià)值的充分釋放
在人工智能向千行百業(yè)快速滲透的背景下,DeepSeek通過技術(shù)創(chuàng)新大大地降低了大模型的應(yīng)用門檻,推動(dòng)了AI普惠的進(jìn)程,也標(biāo)志著大模型逐步進(jìn)入規(guī)模化落地新階段。中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏稱其為“大模型2.0”階段。
此前人們追求的是更大參數(shù)規(guī)模的大語言模型,如今人們開始關(guān)注如何讓AI普惠,能以更高性價(jià)比讓大模型落地,而DeepSeek就是一個(gè)標(biāo)志——一個(gè)從對(duì)大模型的探索轉(zhuǎn)向規(guī)模化應(yīng)用的標(biāo)志。
“此前人們追求的是更大參數(shù)規(guī)模的大語言模型,如今人們開始關(guān)注如何讓AI普惠,能以更高性價(jià)比讓大模型落地,而DeepSeek就是一個(gè)標(biāo)志——一個(gè)從對(duì)大模型的探索轉(zhuǎn)向規(guī)模化應(yīng)用的標(biāo)志。”
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏在聯(lián)想AI算力基礎(chǔ)設(shè)施技術(shù)創(chuàng)新論壇暨春季新品發(fā)布會(huì)主題演講時(shí)表示。
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長 何寶宏
隨著大模型2.0時(shí)代的來臨,大模型的應(yīng)用邊界不斷突破,催生了AI繪畫、文本創(chuàng)作、代碼生成等顛覆性應(yīng)用,推動(dòng)AI從輔助工具向生產(chǎn)力平臺(tái)轉(zhuǎn)變。這一轉(zhuǎn)變導(dǎo)致算力需求結(jié)構(gòu)發(fā)生根本性變化:傳統(tǒng)以推理為主的算力模式,被訓(xùn)練與推理并重、且訓(xùn)練算力占比持續(xù)攀升的新模式取代。
為應(yīng)對(duì)需求的變化,作為AI應(yīng)用的能力底座,算力技術(shù)也在不斷演進(jìn)。聯(lián)想集團(tuán)副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬在發(fā)布會(huì)上表示:“萬卡、十萬卡級(jí)算力集群的出現(xiàn),要求在超大規(guī)模算力集群里,實(shí)現(xiàn)“算存網(wǎng)”能力的高效協(xié)同;而模型本地部署的應(yīng)用潮流,又帶來對(duì)大模型一體機(jī)單機(jī)性能的極致要求。此外,如何獲得極致算力效率與能效也促使異構(gòu)智算等技術(shù)創(chuàng)新快速取得突破。”
在這樣的時(shí)代背景下,陳振寬介紹,聯(lián)想正通過構(gòu)建更強(qiáng)大、更高效、更穩(wěn)定、更綠色的混合式基礎(chǔ)設(shè)施,助力混合式人工智能快速落地,加速AI價(jià)值的充分釋放。
具體舉措包括:
深度構(gòu)建以計(jì)算力、存儲(chǔ)力、運(yùn)載力為核心的AI基礎(chǔ)設(shè)施,打造覆蓋AI全場景、性能領(lǐng)先的AI算力產(chǎn)品組合;
持續(xù)升級(jí)聯(lián)想萬全異構(gòu)智算平臺(tái),融入四大技術(shù)創(chuàng)新,為高效算力提供強(qiáng)大支撐;
堅(jiān)定擁抱生態(tài),全面打造萬全生態(tài),實(shí)現(xiàn)從芯片、系統(tǒng)再到應(yīng)用的全棧能力整合,為客戶提供多種一站式AI解決方案。
02
四大創(chuàng)新技術(shù),打造智算平臺(tái)差異化優(yōu)勢
聯(lián)想萬全異構(gòu)智算平臺(tái)就是上述戰(zhàn)略的落地手段之一。聯(lián)想萬全異構(gòu)智算平臺(tái)是去年推出的一款算力管理平臺(tái)。針對(duì)大模型預(yù)訓(xùn)練和傳統(tǒng)模型推理的算力訴求,聯(lián)想萬全異構(gòu)智算平臺(tái)推出了五大技術(shù),包括算力匹配魔方、超智融合調(diào)度、AI高效斷點(diǎn)續(xù)訓(xùn)、聯(lián)想集合通信庫和GPU內(nèi)核態(tài)虛擬化。
憑著這些創(chuàng)新,平臺(tái)獲得了22項(xiàng)核心發(fā)明,在多個(gè)應(yīng)用案例中出創(chuàng)出佳績。不過,聯(lián)想并不滿足現(xiàn)有的成績,而是一直在打磨這一平臺(tái),在今年的聯(lián)想創(chuàng)新科技大會(huì)上宣布重磅升級(jí),推出了聯(lián)想萬全異構(gòu)智算平臺(tái)3.0。
聯(lián)想萬全異構(gòu)智算平臺(tái)的研發(fā)負(fù)責(zé)人、聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略管理部總監(jiān)黃山介紹,聯(lián)想萬全異構(gòu)智算平臺(tái)3.0中新增的四大差異化技術(shù)就是為了助力眾多用戶在AI預(yù)訓(xùn)練、后訓(xùn)練、推理的過程中取得最高效、最穩(wěn)定的算力。
01
AI推理加速算法集:通過實(shí)現(xiàn)MLA、投機(jī)推理等關(guān)鍵技術(shù),結(jié)合聯(lián)想自己的混合精度量化和分布式并行技術(shù),最大程度地發(fā)揮GPU效能,使AI推理性能相對(duì)業(yè)界最優(yōu)方案保持20%以上優(yōu)勢。
02
AI編譯優(yōu)化器:自動(dòng)替換低效算子、優(yōu)化計(jì)算路徑并重新編譯,大幅簡化AI計(jì)算過程,節(jié)省算力和顯存資源,相比同類編譯器可降低訓(xùn)練和推理計(jì)算開銷各15%以上。
03
AI訓(xùn)推慢節(jié)點(diǎn)故障與自愈系統(tǒng):通過異步實(shí)時(shí)狀態(tài)監(jiān)測與全面故障分析,提前預(yù)知并自動(dòng)化解決故障,將發(fā)現(xiàn)故障及自愈時(shí)間控制在百卡秒級(jí)、千卡分鐘級(jí)、萬卡十分鐘級(jí)。
04
專家并行通信算法:通過協(xié)同優(yōu)化通信計(jì)算原語、訪存方式和網(wǎng)絡(luò)路由算法,減少通信延遲和帶寬占用,將推理延時(shí)降低至原來的1/3以下,同時(shí)將訓(xùn)推過程中網(wǎng)絡(luò)帶寬利用率從50%提升至90%。
