5月7日,2025聯(lián)想創(chuàng)新科技大會(huì)(Tech World)在上海世博中心舉行,本屆大會(huì)以“讓AI成為創(chuàng)新生產(chǎn)力”為主題,聚焦混合式AI,從終端到云端、從個(gè)人到企業(yè),展示一系列創(chuàng)新技術(shù)和全新成果。在下午“智能云與智能體技術(shù)創(chuàng)新論壇”上,上海交通大學(xué)計(jì)算機(jī)學(xué)院陳全教授發(fā)表了題為《AI驅(qū)動(dòng)下的智能云架構(gòu)與系統(tǒng)設(shè)計(jì)》的演講,深入探討了AI技術(shù)與智能云架構(gòu)的融合以及與聯(lián)想智能云的合作。
在“智能云與智能體技術(shù)創(chuàng)新論壇”上,陳全教授指出,智能云并非單純的學(xué)術(shù)概念,而是涉及學(xué)術(shù)界與產(chǎn)業(yè)界的深度合作。他將智能云的特點(diǎn)歸納為“智能”和“云”兩個(gè)維度,強(qiáng)調(diào)為了實(shí)現(xiàn)智能云,需要學(xué)術(shù)界和產(chǎn)業(yè)界的共同配合。學(xué)術(shù)界負(fù)責(zé)理論研究和技術(shù)預(yù)演,產(chǎn)業(yè)界則通過產(chǎn)學(xué)研合作將技術(shù)落地并提供反饋。陳全教授對“Cloud for AI”和“AI for Cloud”進(jìn)行了分享,前者強(qiáng)調(diào)云平臺對AI應(yīng)用的支持,后者則利用AI技術(shù)提升云平臺的智能化水平。
陳全教授進(jìn)一步指出,在Cloud for AI方面,隨著AI應(yīng)用的普及,云平臺的負(fù)載逐漸從傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用轉(zhuǎn)變?yōu)槎鄻踊腁I應(yīng)用。為了高效支持這些AI應(yīng)用,云平臺需要滿足一系列新的需求:
l異構(gòu)加速器管理:未來的AI負(fù)載將涉及多種計(jì)算模式,如稠密計(jì)算、動(dòng)態(tài)計(jì)算和稀疏計(jì)算等,這要求云平臺能夠有效管理各種異構(gòu)加速器(如GPU、NPU等),實(shí)現(xiàn)資源的隔離與共享。
l資源池化與共享:云平臺需要通過軟件定義的資源池化結(jié)構(gòu),實(shí)現(xiàn)資源的快速重新配置,以適應(yīng)不斷演進(jìn)的智能計(jì)算負(fù)載,同時(shí)解決池化后性能受損的問題。
l并行機(jī)制優(yōu)化:針對AI的多種并行模式(數(shù)據(jù)并行、模型并行、流水線并行等),云平臺需根據(jù)硬件互聯(lián)拓?fù)溥x擇合適的并行方式,以提升整體性能。
l全局協(xié)同編排:在多個(gè)應(yīng)用同時(shí)運(yùn)行時(shí),云平臺應(yīng)通過混合動(dòng)態(tài)的全局編排,提高平臺吞吐量,同時(shí)確保各應(yīng)用性能不受損。
而在AI for Cloud方面,AI技術(shù)不僅服務(wù)于云平臺上的應(yīng)用,還可以用于提升云平臺本身的智能化水平:
l細(xì)粒度資源管理:由于用戶往往難以準(zhǔn)確預(yù)估應(yīng)用所需的資源量,導(dǎo)致資源浪費(fèi)和性能波動(dòng)。通過AI技術(shù),可以捕捉用戶資源需求的時(shí)空波動(dòng),實(shí)現(xiàn)更加細(xì)粒度的資源管控。
l資源用量預(yù)測與自動(dòng)混合擴(kuò)展:利用時(shí)間序列分析和多種AI模型,自動(dòng)預(yù)測資源用量,選擇最佳模型進(jìn)行資源調(diào)度,實(shí)現(xiàn)自動(dòng)混合擴(kuò)展,快速調(diào)整資源分配。
l效率提升與成本優(yōu)化:通過AI技術(shù),顯著降低調(diào)度開銷,減少調(diào)度數(shù)量40%,改善服務(wù)質(zhì)量,降低典型應(yīng)用延遲30%以上,節(jié)省20%-60%的整體系統(tǒng)資源分配。(數(shù)據(jù)來源于實(shí)驗(yàn)室環(huán)境)
陳全教授還分享了上海交通大學(xué)與聯(lián)想智能云在智能云領(lǐng)域的合作成果,雙方通過產(chǎn)業(yè)界提供技術(shù)難題、學(xué)術(shù)界進(jìn)行理論研究和原型設(shè)計(jì)的方式,共同推動(dòng)智能云技術(shù)的發(fā)展。在“Cloud for AI”方面,雙方正在探索面向未來AI負(fù)載的云平臺形態(tài),包括體系結(jié)構(gòu)設(shè)計(jì)、加速器管理、并行機(jī)制優(yōu)化等;在“AI for Cloud”方面,雙方合作使用AI技術(shù)進(jìn)行超級細(xì)粒度的資源管理,提高資源使用效率。
陳全教授表示,“通過聯(lián)想智能云的平臺部署和持續(xù)反饋,團(tuán)隊(duì)能夠不斷改進(jìn)技術(shù),實(shí)現(xiàn)AI與智能云的深度融合,為產(chǎn)業(yè)升級提供新的動(dòng)力。”