1月23日,北京智譜華章科技有限公司宣布旗下智譜GLM-PC開放體驗,標志著自主操作電腦的多模態Agent迎來重要升級。
GLM-PC是基于智譜多模態大模型CogAgent,全球首個面向公眾、回車即用的電腦智能體。它能像人類一樣“觀察”和“操作”計算機,協助用戶完成各類電腦任務。
GLM-PC v1.0于2024年11月29日發布并開放內測。此次升級推出了“深度思考”模式,增加了專用于邏輯推理和代碼生成的功能,還提供了對Windows系統的支持。
GLM-PC具備多項強大能力。在代碼生成與邏輯執行規劃方面,可綜合分析目標與可用資源,生成執行路線圖并分解大型任務。循環執行功能可在規劃后啟動代碼生成模塊,實現從輸入到輸出的完整閉環。其長思考能力能實時調整、反思修正和自我糾錯。
在圖像與GUI認知上,能準確識別圖形界面元素,理解功能與交互邏輯,還能進行圖像語義解析和多模態信息融合。
智譜GLM-PC的開放體驗,為用戶帶來了更智能、高效的電腦操作新體驗,有望在辦公、學習等諸多領域發揮重要作用。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
Agent
+關注
關注
0文章
185瀏覽量
28709 -
大模型
+關注
關注
2文章
3650瀏覽量
5179
發布評論請先 登錄
相關推薦
熱點推薦
華為昇騰深度適配智譜AI全新開源模型GLM-5
2026年2月12日,智譜AI發布Agentic Engineering時代最好的開源模型GLM-5,從“寫代碼”到“寫工程”的能力進一步演進。在Coding與Agent能力上取得開源SOTA表現
大模型 ai coding 比較
中文通用場景
智譜GLM-5
Kimi K2.5 / MiniMax M2.5
性價比優先通用場景
Claude Sonnet 4.5
智譜GLM-5
發表于 02-19 13:43
大模型競爭白熱化!智譜、MiniMax密集發布,DeepSeek V4路線圖曝光
2月11日晚間,智譜發布新一代旗艦模型GLM-5,智譜稱,GLM-5在Coding與Agent能力上,取得開源SOTA表現,在真實編程場景的
寒武紀實現對GLM-5的Day 0適配
2026年2月11日,寒武紀已基于 vLLM 推理框架同步實現對智譜最新開源旗艦模型 ?GLM-5 的適配。寒武紀一直高度重視大模型軟件生態建設,借助于成熟的自研 Neuware 軟件生態和長期
智譜AI正式上線并開源全新一代大模型GLM-5
智譜AI正式上線并開源全新一代大模型GLM-5。作為面向復雜系統工程與長程Agent任務打造的新一代模型,GLM-5在Coding與Agent
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
GLM-4.6V系列多模態大模型及GLM-OCR,沐曦股份均在第一時間完成全面適配。 此次高效適配依托于沐曦股份全棧自研的MXMACA軟件棧——該棧原生兼容PyTorch、Tensor
沐曦曦云C500/C550 GPU產品適配智譜GLM-OCR模型
今天,智譜AI正式發布并開源GLM-OCR,以 “小尺寸、高精度” 實現文檔解析能力新標桿。沐曦股份曦云C500/C550 GPU充分發揮高生態兼容性、軟硬協同能力優勢,高效完成與智譜GLM
華為CANN與智譜GLM端側模型完成適配
2025年8月5日,在昇騰計算產業發展峰會上,華為宣布CANN(Compute Architecture for Neural Networks)技術體系及Mind系列工具鏈全面開源開放。此前,智譜
【HZ-T536開發板免費體驗】3 - Cangjie Magic調用視覺語言大模型(VLM)真香,是不是可以沒有YOLO和OCR了?
和管理 Agent 的專用語言。它允許開發人員通過結構化的系統提示詞、工具和各類協作策略來增強 Agent 的功能。
今天我們就嘗試在開發板上利用質譜AI的視覺語言模型(VLM)模型來進行圖像識別。我們
發表于 08-01 22:15
多模態感知+豆包大模型!家居端側智能升級
的關鍵力量。星宸科技與豆包大模型的合作,將這一技術趨勢落實到實際應用場景中,在智能家居、可穿戴設備以及連鎖店等領域引發了深刻變革。 ? 智能家居升級 ? 陳立敬指出:“智能家居2.0需要大模型大腦”。在智能家居領域,多模態感知與
【「零基礎開發AI Agent」閱讀體驗】+Agent開發平臺
開發平臺提供的大模型多樣性,可將其分為兩類,即單模型平臺及多模型平臺。
2)收集角色與任務指令
通過設計Agent的提示詞,開發者可以通過自然語言,定義Agent的角色,規劃Agent
發表于 05-13 12:24
【「零基礎開發AI Agent」閱讀體驗】+初品Agent
事務和專業事務的處理能力,它是存在于計算機程序等虛擬環境中的虛擬代理人。
Agent并非聊天機器人的升級版,它不僅會告訴你“如何做”,還會“幫你做”。
因此它可以被定義為能自主理解、規劃決策、執行復雜
發表于 04-22 11:51
海康威視發布多模態大模型AI融合巡檢超腦
基于海康觀瀾大模型技術體系,海康威視推出新一代多模態大模型AI融合巡檢超腦,全面升級人、車、行為、事件等算法,為行業帶來全新的多模態大模型巡
?多模態交互技術解析
多模態交互 多模態交互( Multimodal Interaction )是指通過多種感官通道(如視覺、聽覺、觸覺等)或多種交互方式(如語音、手勢、觸控、眼動等)與計算機系統進行自然、
智譜 GLM-PC 開放體驗,多模態 Agent 升級
評論