摘要:應用驅動
文 | 山核桃 無銹缽
“過去這24個月,這種全球性的大模型狂熱,究竟是一場新的技術革命,還是新一輪泡沫?”
11月12日的百度世界大會上,以標志性白襯衫現身的百度集團創始人兼CEO李彥宏在他的演講開頭,就向外界拋出了這一重磅的“大模型之問”。
AI究竟是不是泡沫?
李彥宏和百度對這一“大模型之問”的回答顯然很堅定——AI不是泡沫,文心大模型調用量的高速增長印證了這一點。
截至目前,百度文心大模型的日均調用量已超15億次,相較一年前首次披露的5000萬次,增長約30倍,這說明AI是真需求,大模型應用正處于爆發前夜。
李彥宏和百度沒有滿足于此。在剛剛結束的百度世界大會上,百度發布了最新的檢索增強的文生圖技術(iRAG)和無代碼工具“秒噠”。
未來已來,人們與“AI應用創造世界的距離”,又近了一步。
1、為「超級有用」鋪路造橋
“我們不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數以百萬‘超級有用’的應用?!?/p>
在此次百度世界大會上,李彥宏率先在行業里喊話——“要打造超級有用的應用”的原因所在。
iRAG技術和無代碼工具“秒噠”,其實是百度為“加速應用滲透”送上的錘子。
想讓大模型落地直接應用、產生實用價值,國內外大模型廠商其中的一個主線任務,就是各出奇招解決大模型的“幻覺問題”。
李彥宏認為,?過去24個月,大模型的最大變化是基本消除了“幻覺”?,這主要得益于RAG(檢索增強生成)等技術對模型性能等提升。
RAG技術結合了信息檢索和生成的能力,有效提高了大模型文本內容生成的質量,但隨著圖像等多模態AI的飛速發展,大模型的“幻覺”問題變得越來越復雜,各類文生圖模型盡管反復宣稱在生成效果上“超越人類設計師”,但在實際使用過程中,用戶的翻車體驗并不在少數。
在AI生圖領域,怎么殺死“幻覺”?關鍵時刻,還是百度帶來了好消息。
據百度CTO王海峰介紹,在今年年初,百度就決定下場通過自研iRAG技術,結合不同應用場景下用戶具體的生圖需求,解決圖像生成的幻覺問題。
王海峰具體介紹了iRAG實現可控生圖的技術鏈路,和此前百度的檢索增強技術類似,這依舊是一個“理解-檢索-生成”協同優化的過程。
首先,大模型會用戶的具體需求進行分析理解,自動規劃精確或者泛化的方案,比如對哪些實體進行增強;
其次,在增強階段,對需要增強的實體進行檢索,并選擇對應的參考圖;
最后,在生成階段,百度自研了多模態可控生圖大模型,一方面,通過局部注意力計算,大模型能在保持實體特征不變的情況下,實現圖像的高泛化生成;另一方面,通過整體注意力計算,可實現圖像的高精確生成,保持生成圖和原圖相關物體等元素的一致性。
「財經無忌」以“錘子手機”、“虎皮雞蛋”等prompt,實測文心一言AI生圖功能發現,對比國內其他模型廠商,在iRAG技術加持下,所生成的圖片對prompt的理解更準確,圖片的生成質量也不錯。
左圖為其他廠商,右圖為文心一言
以人物動作和環境的一致性,我們以“生成一張在玩手機的華妃的圖”為需求,也“考了考”文心一言的表現,不到20s文心一言就完成了任務,所生成的圖片也與真實世界高度相似,沒有什么“AI味兒”。
對prompt的理解、人物一致性、 生成速度都超出我們預期
iRAG技術無幻覺、超真實、低成本、立等可取等一系列優勢,這也意味著,小到普通自媒體工作者的圖文編輯,大到上市公司宣傳海報制作,都有望直接從中受益,AI應用的空間也得以打開。
李彥宏在接受媒體專訪時也提到:“多模態要想進入真正實用階段,也得有準確性,或者說可控性。讓你不變就不能變。有了這種能力后,應用空間才能打開”。
除了消除大模型的幻覺,是AI應用爆發的技術前置條件,更關鍵的是還有找到大模型時代應用落地的載體。
百度瞄準的方向就是就是智能體。
今天,智能體幾乎已成為頭部大模型廠商探索的“標配”。
麥肯錫報告顯示,過去的一年里,Google、OpenAI都將智能體作為大模型最重要的應用場景,OpenAI創始人奧特曼近期采訪中提及「5級AGI」藍圖里也反復強調“智能體”的作用:“第三級是智能體,能夠執行長期任務,比如與環境多次互動,并與人類協同工作”。
李彥宏認為,智能體相當于 PC 時代的網站和自媒體時代的賬號,其特點是門檻低、天花板又足夠高。
本質上,智能體是一個更輕量化、更具主動性和更強交互性的AI應用,但對一個毫無編程經驗的普通人來說,想要創造一個專屬智能體或實現多智能體的協作,依舊有很高的門檻。
而百度的無代碼工具“秒噠”的誕生,解決了這一問題,用戶只需要向大模型表達出自己所需要的智能體工作流等信息,僅依靠自然語言交互,就可以完成一整套系統的設計、開發、測試。
區別于其他的低代碼或無代碼開發平臺,“秒噠”的特色有兩點:一是不局限在程序員等開發者,門檻更低。二是整個應用的開發過程,可實現多智能體的協作。
據王海峰透露,這主要是因為“秒噠”所采用的是智能體的“中心化模式”。
舉例來說,如果用戶想針對某新技術發布會開發一個嘉賓邀請和管理系統,“秒噠”在受到需求后,“小組長智能體(0號智能體)”進行規劃調度,將任務拆解并召喚各智能體來完成任務,策劃設計方案會交給“策劃智能體”,文字編輯內容會交給“編輯智能體”,網頁的代碼編寫、系統制作和部署由“程序員智能體”完成,最后還有負責質檢的智能體,檢查和測試代碼,并能和其他智能體配合一起改bug。
總結來看, iRAG技術進一步解決大模型的“幻覺”,“秒噠”則是以低門檻的方式讓小白輕松上手應用開發,為「超級有用」鋪路造橋的百度,其實也為應用爆發打好了基礎。
2、祛魅超級應用,從“智能涌現”到“價值涌現”
“國外有一種說法叫‘軟件吞噬世界’。但我認為,這個世界不應該被吞噬,而應該被創造。AI時代,應用創造世界?!?/p>
在漫長的科技史上,對新技術的質疑,從來都不是什么新鮮話題。
那些“AI泡沫論”的擁躉者,所給出的理由是:“至今未出現一個大模型時代的超級應用”。
這實際陷入了一個“應用誤區”——對“超級應用的過度迷戀”。過去兩年里,市場涌現出諸多號稱“大模型時代的超級應用”,但又迅速衰落,根本原因在于“好看但不有用”,難以與個人、企業的實際場景和需求結合,形成產品迭代的增長飛輪,自然也難以長紅。
“如果說2023年大家還在卷模型,讓模型能力逐步地達到可用地步的話,那未來所謂的‘可用’,就是真的有東西用?!崩顝┖暾f。
“超級應用”到“超級有用”,一字之差,所對應的是兩種完全不同的認知和實踐邏輯。
一方面,在認知上強調“有用”更偏向談生成式AI的落地價值,而不是“為了創新而創新”;另一方面,在實踐上強調“有用”是關注用戶和企業的實際需求,避免“拿著錘子找釘子”。
在“超級有用”的思路下,再看百度推出iRAG技術和無代碼工具“秒噠”,其實有更深遠的兩重含義:
一是將真技術創新與真需求場景融合,降低普通人實踐AI的門檻,打開AI應用落地的規?;臻g。
無論是關注幻覺問題的iRAG技術,抑或是讓零編程經驗的普通人也能手搓智能體的“秒噠”,都是百度結合現有模型能力,將復雜的技術場景留給自己,將最簡單的體驗留給用戶,縮短人們與AI間的距離。
二是在瞬息萬變的技術發展中為更多人找到可確定的方法論。在GPT-5遲遲未至,Scaling law放緩的諸多質疑中,李彥宏認為,這對應用層來說是反而是新機遇。
“從應用端來看,技術進步的速度不僅沒有放慢,甚至有變快趨勢。從另外一個角度來講,反而是基礎模型不能夠特別快的迭代,如果老在變,那做應用的人就無所適從了?!?/p>
當然,長期來看,在復雜的應用場景里,模型能力的提升依舊還會遵循大力出奇跡的Scaling law或依賴模型精調、數據標注等工程化手段,但在一些相對沒有那么復雜的應用場景里,比如代碼領域,人們可以借助大模型能力,提升認知、創造價值,這是確定性的趨勢。
“我今天能夠寫兩百行代碼,一年以后可能能寫兩千行代碼,再過三年可以寫兩萬行代碼,這個能力會逐步發展出來,那它會讓更多人的創造性給激發出來?!崩顝┖暾f。
而當更多人看見AI產生的實際價值,大模型或許也能從“智能涌現”、“能力涌現”再到最終實現“價值涌現”。
3、中國大模型彎道超車,機會是應用驅動
伴隨AI成果的涌現,人們也在關注中國大模型的“未來之問”:
中國大模型產業爆發能否復刻移動互聯網時期的輝煌?中國AI公司與硅谷企業相比,又有哪些比較優勢?
回到“第一性”原理,李彥宏認為百度就是“應用驅動”。
”美國很多公司一直都是夢想說我要做顛覆性的技術,我更多希望盡早接觸場景及接觸應用,看在這個過程當中,到底遇到了什么問題,把這些問題帶回來,我們綜合看一下,大家遇到的最多的問題,就是我們優先解決的問題。“李彥宏解釋。
“應用驅動”既是百度的底層戰略思考,也是中國大模型彎道超車的優勢。
畢竟,從移動互聯網時代開始,中國就誕生出諸多超級應用,在技術落地的終端入口上,中國同樣也是全球最大的消費電子生產國、出口國和消費國。在迭代的技術革命主題背后,將技術創新與市場需求結合,落地用戶端的應用,這一直都是中國廠商的優勢和機遇所在。
近期,由弗若斯特沙利文發布的《2024年全球AI生態全景概覽》中,百度也和 OpenAI、谷歌一起,成為了全球唯三被該機構承認的“AI 原生巨頭”。
作為中國唯一一個榜上有名的公司,這份榜單恰好給出了我們答案:中國大模型彎道超車,機會就在應用驅動。
關于應用的故事,李彥宏和百度顯然瞄準的是AI的長期主義,十二年前,投身AI浪潮的百度選擇成為彼時AI火種的傳播者時,沒人能想到這場“應用來了”的浪潮或許將改變每個參與者的命運。
現在,他們繼續沿著這條路行走,李彥宏將人工智能比喻成“一次新的工業革命”:“這意味著它不是三五年就結束,不是一兩年就出現‘超級應用’的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構?!?/p>
拉長科技史,無論是微軟谷歌,抑或是如今的英偉達,那些將經歷放在?!凹夹g是否真的有用”的科技巨頭也都收獲了時間的玫瑰,或許如李彥宏所言“我們即將迎來AI應用的群星閃耀時刻”,而中國大模型,也有望借助應用驅動,講述更多的新故事。