隨著大模型迭代的浪潮一波接一波地推高技術(shù)前沿,Agent技術(shù)已經(jīng)成為大模型落地的主流選擇,并被視為賦予大模型更廣闊能力的最佳路徑。從理解復(fù)雜的指令,到處理多模態(tài)信息,從簡單的問答系統(tǒng)到復(fù)雜的決策支持系統(tǒng),從個性化推薦到自動化的業(yè)務(wù)流程管理,陸續(xù)在更多領(lǐng)域展現(xiàn)出其巨大的潛力和價值,它正在為社會帶來深刻的變革。
在這場趨之若鶩的群體行動中,面對這項持續(xù)發(fā)展變化的技術(shù)簇,我們應(yīng)采取一種積極探索與謹(jǐn)慎評估并重的策略——既要保持理性,也要保持樂觀,以此來應(yīng)對不確定性。技術(shù)的更新迭代需要時間與耐心,而技術(shù)的應(yīng)用則需了解其限制和準(zhǔn)確判斷業(yè)務(wù)場景。
要有效利用大模型,首先,必須明確他們的優(yōu)勢和不足(圖1)。接下來,整理業(yè)務(wù)操作流程即業(yè)務(wù)SOP,確保對業(yè)務(wù)場景有深刻理解和準(zhǔn)確的認知。其次,對領(lǐng)域知識進行必要的梳理。第四,在搭建Agent的過程中,盡可能的規(guī)避LLM的局限(例如,通過多輪對話精準(zhǔn)捕捉識別用戶意圖)。第五,要做好企業(yè)內(nèi)專業(yè)資料的處理和必要工具的建設(shè)。最后,準(zhǔn)備好對Agent進行持續(xù)的優(yōu)化(效果優(yōu)化),從而在應(yīng)用大型模型時發(fā)揮其優(yōu)勢,規(guī)避弱點。
一、大模型原生能力&局限
大模型擅長語義理解、邏輯推理以及生成和創(chuàng)作內(nèi)容。然而,它們目前存在一些限制,包括對特定領(lǐng)域的深入理解和時效性不足、有限的記憶能力、在實際情況中的魯棒性不夠,導(dǎo)致錯誤、潛在的安全風(fēng)險、推理和規(guī)劃能力尚待提升、缺少合作意識而無法協(xié)同解決復(fù)雜問題、以及缺乏視覺和聽覺等感官能力,有時生成的信息可能不精確或是虛構(gòu)的。在構(gòu)建Agent時,可以通過集成其他技術(shù)和能力來補充和改進大模型的這些不足。
另外,一些限制更多地取決于大型模型自身能力的提升。例如,泛化能力和過度擬合現(xiàn)象,這可能導(dǎo)致對含糊不清的信息的理解出現(xiàn)歧義,或者混淆了特定領(lǐng)域的知識。模型處理上下文的能力也受到長度的限制。模型的可解釋性和可調(diào)試性不足,使其在某些情況下表現(xiàn)得像一個局部的黑箱。由于模型參數(shù)眾多,推理過程耗時較長。此外,微調(diào)模型對高性能的GPU和TPU計算資源的需求也相對較大。
二、Agent
為讓大模型更充分的發(fā)揮價值,突破當(dāng)前的局限,主流趨勢是通過Agent增強能力(大腦),為大模型增加眼耳鼻口手腳的能力。
2.1 Agent框架
Agent為大模型提供了執(zhí)行復(fù)雜任務(wù)、與環(huán)境交互、自主決策和長期記憶等關(guān)鍵能力,使得大模型的應(yīng)用從單純的語言處理擴展到更廣泛的領(lǐng)域,包括自動化任務(wù)執(zhí)行、客戶服務(wù)、內(nèi)容創(chuàng)作等,極大地擴展了AI的實用性和影響力。為了實現(xiàn)這樣一套解決方案(圖2),背后需要用工程化的手段落地——工具鏈。
2.2 一站式AI Agent開發(fā)工具鏈
Agent開發(fā)平臺是面向智能體生產(chǎn)場景的一站式開發(fā)工具,具備智能體編排、流程搭建、知識庫管理、大小模型交互、計量、開放、私有化部署等功能,能夠有效提升智能體研發(fā)效率,降低研發(fā)成本。目前國內(nèi)知名的Agent開發(fā)平臺包括百度的千帆、阿里的百煉、字節(jié)的Coze、Dify以及騰訊的元器等。
2.3 工具鏈競品分析
1)字節(jié)Coze
Coze平臺專為零代碼或低代碼(可視化編排)開發(fā)者設(shè)計,極大地降低了開發(fā)門檻,使得非技術(shù)人員也能快速上手。
優(yōu)勢:
功能強大(圖像流、通過觸發(fā)器實現(xiàn)自動化的任務(wù)調(diào)度和執(zhí)行、多渠道發(fā)布)
高度可定制
支持豐富的主流第三方插件
數(shù)據(jù)源多樣
但整體的動線繁瑣,用好的門檻比較高。
2)騰訊元器
網(wǎng)站風(fēng)格一如既往的“節(jié)制”,功能布局清晰易懂,用戶無需花費腦力去理解網(wǎng)站的結(jié)構(gòu)、布局和導(dǎo)航。該有的元素都有,后續(xù)在生態(tài)建設(shè)上,期待看到更多的可能,包括且不限于更豐富的大模型可選、插件……
3)Dify
是做LLM應(yīng)用開發(fā)平臺中最早的一批之一,且功能性甚至比國內(nèi)頭部大廠更突出,相比之下,目前它是是Github上Star數(shù)最多的大模型應(yīng)用開發(fā)工具(54000星),是全球LLM Tools增速Top1的開源項目(300萬的安裝量)。
優(yōu)勢:
AI生態(tài)相對最好:支持40多家廠商的大模型,對接大模型平臺、對接開源大模型,全鏈路免費。上百種插件
成功打開海外市場
提供云服務(wù)和本地部署兩種方式,滿足了不同用戶的需求,同時支持多平臺發(fā)布應(yīng)用
自動化流程搭建和數(shù)據(jù)處理方面具有明顯的優(yōu)勢,適合需要構(gòu)建復(fù)雜自動化流程或處理大量數(shù)據(jù)的用戶
4)百度千帆AppBuilder
千帆AppBuilder提供全面便捷的應(yīng)用開發(fā)套件與資源環(huán)境,包括大模型驅(qū)動的開發(fā)組件(文字識別、文生圖等多模態(tài)能力),內(nèi)置RAG(檢索增強生成)、Agent(智能體)、GBI(智能數(shù)據(jù)分析)等常用的AI原生應(yīng)用框架,語音識別、TTS、文生圖等AI能力組件,以及各類IAAS云資源。使得開發(fā)者能夠在一個平臺上完成從應(yīng)用開發(fā)到部署的全過程,大大提高了開發(fā)效率。
優(yōu)勢:
千帆大模型平臺提供了從模型設(shè)計、訓(xùn)練到部署、優(yōu)化的全流程支持
平臺42個大模型,預(yù)置41個數(shù)據(jù)集。內(nèi)置103套Prompt模版及自動化Prompt工程能力
預(yù)置的安全模塊可以有效控制輸入和輸出的安全風(fēng)險,為用戶提供全面的模型安全、內(nèi)容安全和數(shù)據(jù)安全保障
自研集群,為企業(yè)節(jié)約了算力成本和時間成本
生態(tài)能力強大,預(yù)置100+優(yōu)質(zhì)官方組件
自主規(guī)劃準(zhǔn)確,支持人工編排以高效還原業(yè)務(wù)SOP