以下文章來源于谷歌云服務,作者 Google Cloud
從 Chatbot 向 Agentic AI (智能體) 演進的過程中,推理能力的瓶頸 (ReasoningCeiling) 和多模態鏈路的碎片化是阻礙工程落地的兩大難題。本文深度解析昆侖天工旗下天工 Skywork 如何通過Google 的 Gemini 3模型家族,并結合Google Distributed Cloud (GDC)混合云架構,成功構建面向 Windows 生態的桌面級 Agent,在 GAIA 基準測試中實現全球第一,更助力Skywork在海外用戶復雜研報生成場景中將端到端延遲降低 63%。
面對多步推理死循環、多模態處理鏈路割裂以及企業級數據主權三大技術挑戰,更好解決海外用戶的各種復雜需求,Skywork 技術團隊選擇與Google Cloud深度合作,通過引入 Gemini 3 模型與機密計算技術,完成了底層架構的全面重構。
突破推理天花板: 基于 Gemini 3 DeepThink 的多路徑決策
推理死循環與淺層輸出:在早期的海外業務實踐中,當 Agent 面對高復雜度的專業任務 (如 "閱讀 100 頁金融財報并生成符合品牌規范的 PPT") 時,往往受限于模型的單鏈推理能力,容易陷入邏輯死循環或僅能生成淺層的摘要信息,無法滿足 "專家級" 交付標準。
解決方案:
Skywork 引入了Google Gemini 3及其Deep Think能力。不同于傳統的 CoT (思維鏈),Gemini 3 允許 Agent 在推理階段同時探索多條潛在的解決路徑 (Reasoning Paths),并對中間結果進行自我評估與修正。
● 架構優化:從單一的 "Prompt-Response" 模式轉變為 "Plan-Execute-Reflect" 的自主循環架構。
● 性能實測:在全球通用的 GAIA (General AI Assistant) Benchmark 中,重構后的 Skywork Agent 以 82.42% 的準確率斬獲全球榜首,證明了其在高難度、多步驟現實任務中的魯棒性。
鏈路融合: 1M+ 上下文重塑多模態工作流
碎片化模型的延遲累積:在處理包含圖表、視頻會議錄音和文本的混合數據時,傳統方案通常采用 "流水線模式"。這種包含 5 個獨立模型的碎片化管道導致了嚴重的上下文丟失和極高的端到端延遲,難以滿足海外用戶對極致流暢體驗的需求。
解決方案:
Skywork 利用 Gemini 原生的多模態理解能力和1M+ Token的超長上下文窗口,將原本割裂的流水線重構為單一的統一數據流。
● 技術實現:摒棄中間件轉譯,直接將原生視頻流、音頻流和文檔數據注入 Gemini 模型上下文。
● 效率提升:復雜深度研究報告的生成時間從3 小時大幅縮減至 60 分鐘以內,生產力效能提升63%,實現了真正的 "Near Real-time" 交互體驗。
混合云架構: Google Distributed Cloud 支撐的數據主權與機密計算
Skywork 的海外市場包括大量對數據隱私極為敏感的金融與法律行業客戶。這些 "云猶豫" (Cloud-Hesitant) 型企業要求數據在處理過程中必須滿足嚴格的數據駐留 (Data Residency) 規定。
解決方案:
為了在利用全球云端算力的同時保障數據主權,Skywork 采用了混合云部署策略:
● 邊緣部署:通過Google Distributed Cloud (GDC),將 Gemini 驅動的 Agent 部署在海外客戶的本地環境或邊緣節點。
● 機密計算:啟用 Google Cloud 的機密計算節點,確保數據在內存處理態 (Data-in-use) 全程加密,即使是云服務商也無法窺探。這一特性成為 Skywork 成功打開國際高端企業市場的 "敲門磚"。
● 市場反饋:這一架構成功消除了海外高合規行業的顧慮,在企業級試點項目中實現了97%的超高用戶留存率。
生態協同: One Google 技術棧的集成優勢
Skywork 的技術演進不僅僅是模型的替換,更是對"One Google"技術棧的深度集成。
● Google Workspace API 集成:Agent 可直接通過安全 API 操作 Docs、Sheets 和 Slides,將非結構化的推理結果轉化為結構化的辦公文檔。
● MSP 合作伙伴支持:在架構遷移過程中,Google Cloud 提供了關鍵的工程化支持,協助團隊針對 Gemini 3 的長上下文特性進行了精細化的 Prompt Engineering 調優,確保了復雜任務的高并發穩定性。
結語
從 Claude 遷移至 Gemini 3,天工 Skywork 完成了從 "對話式 AI" 到 "自主智能體 (AutonomousAgent)" 的技術跨越,并成功在出海賽道上建立了領先優勢。這一實踐證明,在構建面向全球的下一代桌面級 OS Agent 時,原生多模態能力、長上下文推理以及混合云安全架構缺一不可。Google Cloud 提供的全棧 AI 基礎設施,正在成為天工 Skywork 規模化落地全球市場的核心引擎。
關于昆侖天工
昆侖天工是昆侖萬維旗下子公司,專注 AGI 與 AIGC 業務,是國內少數真正踐行全模態輸入與全模態輸出路徑的 AI 公司,也是 AI 行業 "務實主義" 標桿,以實現 AGI 為核心愿景,自研 8 大核心大模型,覆蓋文本、視頻、音樂、音頻、3D 等多領域,構建 "底層架構-技術能力-場景落地" 完整體系。依托底層統一全模態架構,打破模態壁壘,結合海外布局優勢,實現 AI 音樂 Mureka、AI 社交 Linky、AI 智能體 Skywork 等業務規模化變現,海外收入占比極高,形成 "研發-落地-變現-迭代" 良性閉環,憑借技術硬實力與商業落地能力,成為 AGI 賽道最具潛力的落地樣本。
行業:科技
地區:中國
使用的產品:Confidential Computing,Google Workspace API,Google Gemini
-
Google
+關注
關注
5文章
1807瀏覽量
60510 -
AI
+關注
關注
91文章
39755瀏覽量
301355 -
模型
+關注
關注
1文章
3751瀏覽量
52099
原文標題:天工 Skywork 攜手 Google Cloud,以 Gemini 3 定義桌面級 Agent 出海新范式
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
昆侖芯科技亮相2025中國移動供應鏈生態合作大會
企業級Agent系統研發公司九科信息用bit-Agent賦能業務升級
昆侖天工Skywork與Google Cloud深度合作發布桌面級Agent
評論