🎉 Gate.io動態 #创作者激励计划# 火熱進行中!報名參與並發帖解鎖 $2,000 創作大獎!
🌟 參與攻略:
1️⃣ 點擊連結進入報名頁面 👉️ https://www.gate.io/questionnaire/6550
2️⃣ 點擊“是”按鈕提交報名
3️⃣ 在動態完成發帖,提升發帖量和互動量,解鎖獲獎資格!
📌 只要是與加密相關內容均可參與發帖!
🎁 茶具套裝、Gate x 國際米蘭保溫杯、Gate.io 紀念章、點卡等好禮等你來拿!獲獎者還將獲得專屬社區流量扶持,助力您提升影響力,增長粉絲!
活動截止至:5月6日00:00 (UTC+8)
活動詳情:https://www.gate.io/announcements/article/44513
打造「無所不能、無處不在」的 AI,百度爲何要從「操作系統」做起?
作者:拉風的極客
大模型能梳理出中國上下五千年都發生了什麼,卻回答不了現在幾點;能解釋清楚什麼叫量子力學,但卻連做一個圖文並茂的專業級 PPT 都很難辦到。
爲什麼大模型看似無所不能,但實際用起來卻總是差點意思?
原因很簡單,聰明、博學不等於能幹活。
聰明,需要大模型通過海量的知識訓練與學習,練出了發達的大腦,可以很好的回答一個問題;
而同時滿足聰明、能幹兩個要素,則需要給這個聰明的大腦,配上靈活四肢,實現「深度思考+深度交付」。
也是因此,如何推動大模型從聰明的思考,到實現「聰明又能幹」的進化,成爲了決定這輪大模型熱潮究竟是曇花一現,還是改變歷史的勝負手。
百度給出了打樣。
4 月 25 日,在 Create 2025 百度 AI 開發者大會上,百度創始人李彥宏帶來百度文庫、百度網盤聯合推出的全球首個內容領域的操作系統——滄舟 OS。
其通過充分融通百度文庫和網盤過去積累的底層技術、能力、數據,可以像水一樣,融通在不同場景裏面,以最合理的形式、用戶最便捷的交互界面,實現低門檻、和端到端的高質量交付。
依托於滄舟 OS,百度文庫、百度網盤對 AI 的願景和期待,就是在任何時候、任何地方,任何終端設備上,實現真正的一站式、端到端的交付,讓 AI 做到「無所不能、無處不在」。
01
滄舟 OS,讓 AI 邁向操作系統級進化
在科技產業有這樣一個共識,任何技術從實驗室到真正走向千家萬戶,都需要經歷一個漫長的 Gartner 曲線歷程。
在這條曲線中,第一階段的增長,主要取決於技術進步帶來的市場狂熱預期,但隨着技術的落地效果不理想,這一階段的增長會快速進入衰退,直至技術落地所需的條件逐漸成熟,並被具象成幾乎零門檻、無所不能、無處不在的基礎設施,第二階段的生態爆發便會隨之到來。
軟件產業第二階段開啓的標志之一,通常就是一個成熟操作系統的出現,比如 Windows 之於電腦產業,iOS 之於手機產業。
那麼如何定義一個成熟的操作系統?在大約 15 年前,全球的科技產業,有過這樣一個爭論:同樣是能觸屏操作、大屏手機、能打電話、能拍照、能聽音樂、發短信,爲什麼蘋果或者說智能手機與過去的功能機會是兩個物種。
核心原因之一是,iOS 繼承了來自 MAC OS 的內核級穩定性和多任務能力,並將其做成了一個開放生態,開發者們可以任意集成這些蘋果的底層能力,做出自己的創新應用。這也讓如何定義一個手機,從摩托羅拉、諾基亞一兩家巨頭的事,變成了整個生態一起參與,無限可能的龐大產業,自此拉開了此後十多年的移動互聯網的大門。
技術會滾滾向前,但商業故事的劇情總是會踏着相似節拍不斷重復演繹,在手機 OS 中被驗證過的底層邏輯,在大模型時代的 OS 構建上,依然通用。
總結來說有三:完整的底層能力、靈活的中樞調度、繁榮的應用服務生態。正好對應滄舟 OS 的三層架構:底座基建、中樞系統與應用服務。唯一的不同是,應用與中樞、底座中間的橋梁,從以往的 API,換成了更加標準化、低門檻的 MCP。
其中,MCP Server 部分的底座基建,它的核心組件是 Chatfile plus,主要作用是通過知識化框架,對不同模態、不同形態、不同格式的內容做元素級的拆解和解析處理,以及多模理解、多模檢索、文件轉碼解析等一系列工具框架組件。
同時,百度文庫和網盤構建了公域知識庫、私域知識庫、記憶庫「三大庫」,具體指的是百度文庫多年累積的公域知識數據(公域知識庫)、網盤的用戶授權使用的知識數據(私域知識庫)、用戶過往在文庫或網盤操作的指令、使用習慣和歷史生成記錄(記憶庫)。
這些數據往往以不同模態、不同形態、不同格式呈現。其中,公域知識庫提供通用的知識,私域知識庫、記憶庫則保存用戶的個性化數據。
知識化框架中,滄舟 OS 將對「三大庫」中的多模態內容進行向量化、標籤化的處理,也就是將圖片、文本、視頻、音頻、文檔等非結構化數據,通過不同專業模型將其轉化爲計算機可以讀懂的多維向量數據,也就是一組 token。
而在中樞系統上,百度文庫和網盤自研了「三大器」,也就是融合編輯器(對應文檔、PPT 等內容的編輯)、閱讀器(文檔與 PPT 等內容的閱讀)、播放器(音視頻播放)等工具。
同時,滄舟 OS 還可以通過「調度中樞」,通過交互組件、意圖模型和傳輸基建等,結合用戶記憶和畫像數據,通過模型理解用戶意圖,高效分配調度 Agent。
最頂層,則是一系列 AI Agent。「滄舟 OS」集成文庫、網盤的 PPT、AI 繪本、AI 思維導圖、AI 海報、AI 筆記、AI 掃描、AI 聽記等數百項 AI Agent,生成模態涵蓋了圖、文、影、音等各種類型、全面覆蓋學習辦公、生活娛樂等場景,並依托於融合編輯器的編輯、修改、精細調控能力,進而讓檢索和內容生成的質量更高、更符合實際的個性化任務需求。
02
在滄舟 OS 上,
打造更多「聰明又能幹」的 Agent
圍繞最頂層的應用服務,百度文庫 & 百度網盤既推出了數億用戶驗證過的好用的數百項 AI Agent,同時也接入了大量第三方的專業 Agent 做大應用生態。
作爲「一站式 AI 內容獲取和創作平台」,百度文庫的付費用戶已超 4000 萬,AI 月活用戶達 9700 萬。百度網盤也升級爲「一站式內容服務平台」,服務超 10 億用戶,使用空間總和超過 1000 億 GB,AI 月活用戶超 8000 萬。百度文庫、百度網盤已成爲大模型時代真正的「超級生產力」。
在大會上,百度文庫和百度網盤還展示了基於「滄舟 OS」開發的全新能力:「GenFlow 超能搭子」和「AI 筆記」。
GenFlow 超能搭子是百度文庫 APP 推出的多智能體協作能力,有了「滄舟 OS」的加持,內容生成可以做到多任務並行,還能基於最全面專業的聯網信息、用戶自己的習慣和偏好來完成各項任務交付。
比如用戶想要做一個婚禮策劃,但是前期的輸入只有一句簡單的:我想五一在海南辦一場戶外婚禮,幫我做策劃案與邀請函。
需求看似簡單,只要對着歷史模板完形填空就能搞定。但要做到用戶滿意,就需要知道用戶的審美偏好、預算期望、流程偏好,還需要知道五一期間海南的天氣、人流量、場地分布,在此之後還需要將這些圖文與知識通過 PPT 工具進行組合,生成一個完整的方案,最後基於方案以及用戶審美偏好,生成一張完整的婚禮請柬海報。
而要完成以上內容,需要分別調度用戶的歷史聊天記錄、歷史瀏覽記錄,以及意圖識別、全網搜索、PPT 工具,分析用戶意圖,了解用戶偏好,自由組合工具,最終才給出用戶非常具體的包含流程、日期、場地、預算、主題、執行細節、風格、人員安排在內的完整策劃案。
與此同時,用戶需要的策劃案與海報是互相搭配的,這也就需要兩者的所有信息保持一致,用同一套操作系統並行輸出。
當然,AI 一定沒辦法一次生成讓所有人滿意的成果,這就需要無論是婚禮策劃案還是海報都需要具備可編輯能力,而支撐這一能力的,則是「滄舟 OS」的融合編輯器能力。
不難發現,從深度思考到深度交付,GenFlow 超能搭子幾乎是市面上唯一一個真正的「多智能體協作」類產品的現貨。不僅解決了多智能體協作類產品成本高、生成時間長、效率低、無法穩定交付、無法多輪對話調優的通病,更是直接內嵌到成熟產品與用戶授權的私有數據結合,讓 AI 真正有機會實現「無所不能、無處不在」的目標。
百度網盤的 AI 筆記,則是無數辦公黨、考研考公黨的得力幹將。
AI 筆記是業內第一個多模態 AI 筆記, 可以將用戶在百度網盤存儲的各種考研學習視頻和筆記頁面嵌套在同一個界面,實現絲滑聯動,且視頻內容和筆記互相強關聯,從看視頻,到生成 AI 筆記,到總結 AI 腦圖再到最後的 AI 出題檢驗學習成果,完整覆蓋用戶學習的全週期。
舉個例子,英語考研太難成爲了前段時間的熱門話題,用戶想要針對考研英語做集中的復習。AI 筆記會先對用戶網盤中存儲的相關資料進行檢索,同時查詢網上公開資料給出的考點,對其進行整理。但整個過程並沒有停留於此,AI 筆記還會結合歷年真題,對自己生成的考點進行最終校驗,只有經過校驗的考點,才能在此基礎上繼續生成思維導圖、考題預測,幫助用戶加速學習進度。
而在這過程中,涉及的工具調用,並不比做婚禮策劃更少。比如,找考點、找真題需要全網檢索能力,而真題往往以 PDF 甚至圖片的格式呈現,名師解讀則以視頻形式呈現,這就需要多模態內容的解析能力。最終的思維導圖生成與考題預測,則需要大模型的推理能力、多模態內容生成能力,以及與不同內容之間的映射關聯的能力,同時還需要保證內容生成的絕對準確性。
這背後,就是「滄舟 OS」的賦能。
當然,百度支持開發者全面擁抱 MCP,所以滄舟 OS 不只服務於百度的內部生態,操作系統發展壯大最重要的一環是對外開放,激發廣大開發者的創新能力。
所以,爲了讓生態和應用發揮最大價值,百度文庫、百度網盤基於「滄舟 OS」,率先將 MCP 充分運用到產品與生態的連結上,構建 MCP Server-Client-Host 三層體系,將文庫、網盤的能力通過 MCP Server 形式開放,通過 MCP Client SDK,方便更多企業用戶、開發者、智能體應用等 MCP Host 接入。
其中,最有代表性的案例當屬三星手機。三星手機正在接入百度文庫網盤的文件上傳、下載、檢索、分享和內容理解等多個 MCP server。
一方面,用戶在手機的語音助手界面,通過說話方式,就可以直接實現文件的上傳網盤備份、雲上分享、文檔摘要總結和內容問答等功能。
另一方面,這些 server 還能夠豐富三星手機系統的雲存儲能力,解決手機自身對大文件、多文件難以批量備份和分享的問題。
比如用戶在手機相冊裏,喚起語音助手說:「把昨天在奧森拍的照片備份至百度網盤,並把小明的照片發送給他」。相關照片就會被上傳到用戶授權的網盤帳號內,並生成分享連結,手機助手再調用通訊錄,把這個連結通過短信方式發到對方手機上,只要點擊連結,用戶就能直接進入百度網盤查看或轉存。
毫無疑問,檢驗 OS 底層能力是否可靠,並不在於工具的堆砌,或者黑科技的多少。頂層應用服務生態是否好用、成熟與豐富,是 OS 能力的最佳檢驗標準。
03
OS 的故事沒有終點
在資本市場,最被投資者認可的一種企業類型,叫「時間的朋友」。
所謂時間的朋友,就是當企業做對了一件事情之後,接下來只需要繼續做下去,那麼業績就會維持永動機式增長,生態開發者也能持續受益。
而操作系統,就是這樣一個典型的永動機式市場。只要電腦、手機的市場還依然存在,那麼屬於微軟、蘋果、谷歌們的操作系統的故事就沒有終點。
大模型也是同理。當「深度思考+深度交付+公私數據+MCP 生態」集合在一起,未來成爲新時代無所不能、無處不在的 AI,那麼,類似寒武紀的新物種大爆發就將源源不斷的產生。
在這個過程中,向下看,是百度文庫、百度網盤等對自身能力的開放。通過積極擁抱生態,成爲大模型新物種的創造者和新規則的制定者。
向上看,則是無數新的 Agent 基於「滄舟 OS」而被創造出來、被看到,構成磅礴噴湧的新應用服務生態。
而當下,所有故事,才剛剛開始。