近日,微軟官網宣布了一項重要更新。微軟發(fā)布了其視覺Agent解析框架OmniParser的最新版本V2。這一新版本具備將包括OpenAI的4o、o1、o3-mini,DeepSeek的R1,Qwen的2.5VL,以及Anthropic的Sonnet在內的大模型,轉化為“計算機使用智能體”(Computer Use Agent)的能力。
與前代版本相比,OmniParser V2在多個方面實現了顯著提升。在檢測更微小、可交互的元素時,V2展現了更高的精度和更快的推理速度。這一提升得益于V2采用了更大規(guī)模的交互元素檢測數據集和圖標功能描述數據進行訓練。
此外,OmniParser V2還通過縮小圖標描述模型的輸入圖像尺寸,進一步優(yōu)化了推理性能。據微軟官方數據,與前代版本相比,V2的推理延遲降低了60%。這一改進使得OmniParser V2在處理復雜視覺任務時更加高效,為用戶提供了更加流暢、實時的交互體驗。
此次OmniParser V2的發(fā)布,不僅展示了微軟在人工智能領域的持續(xù)創(chuàng)新,也為大模型在計算機智能體領域的應用開辟了新的道路。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6741瀏覽量
107863 -
計算機
+關注
關注
19文章
7807瀏覽量
93203 -
數據集
+關注
關注
4文章
1236瀏覽量
26197 -
大模型
+關注
關注
2文章
3650瀏覽量
5186
發(fā)布評論請先 登錄
相關推薦
熱點推薦
RDMA設計37:RoCE v2 子系統模型設計
本博文主要交流設計思路,在本博客已給出相關博文160多篇,希望對初學者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設計。
RoCE v2 子系統模型是用來模擬 RoCE v2 功能
發(fā)表于 02-06 16:19
微軟發(fā)布多項全新自主式能力企業(yè)智能體
Platform的智能體集成,加速從“記錄系統”邁向“行動系統”,幫助企業(yè)提升線索轉化優(yōu)化運營與推動創(chuàng)新。微軟還聯合哈佛商學院推出實踐資源,助力企業(yè)邁向自主式
微軟Microsoft Copilot Studio智能體平臺全面升級
近期,微軟lgnite大會重磅宣布Microsoft Copilot Studio全面升級,集成智能體構建、自動化與治理,支持多模型和跨平臺集成,強化安全與可控性。企業(yè)可一站式打造高效
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
智能的第一層,也是最基礎的一層。
主要負責從外部環(huán)境中獲取數據,并將這些數據轉化為計算機可以理解的形式。感知層包括各種傳感器和輸入設備,如攝像頭、麥克風、鍵盤和激光雷達等。
作用:是將外部數據
發(fā)表于 09-18 11:45
【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評
賽昉科技VisionFive 2單板計算機開發(fā)板測評作品合集
產品介紹:
昉·星光 2是全球首款集成了3D GPU的高性能量產RISC-V單板計算機
發(fā)表于 09-04 09:08
微軟正式發(fā)布Microsoft行星計算機專業(yè)版
地理空間數據雖賦能能源、農業(yè)、零售等多領域,卻因復雜性與數據孤島問題長期局限于專家群體。微軟正式發(fā)布Microsoft行星計算機專業(yè)版,通過Microsoft Azure(國際版)整合AI技術分析能力,實現海量數據從采集、處理到
新一代神經擬態(tài)類腦計算機“悟空”發(fā)布,神經元數量超20億
電子發(fā)燒友網綜合報道 8月2日,浙江大學腦機智能全國重點實驗室發(fā)布新一代神經擬態(tài)類腦計算機——Darwin Monkey(中文名“悟空”)。 ? “悟空”堪稱國際首臺神經元規(guī)模超20億
在V2板子上部署豆包模型調試指南
在V2板子上部署豆包模型調試指南
準備階段
首先,可以觀看大模型實戰(zhàn)(SC171開發(fā)套件V3)并下載工程源碼,之后我們需要在板子上安裝這個代碼所要用到的一些庫。
pip3 instal
發(fā)表于 05-25 10:17
微軟推出兩款全新銷售智能體
采用智能Mirosoft Copilot副駕駛,企業(yè)構建超40萬個自定義智能體。新功能公開預覽版將于5月發(fā)布,體驗AI銷售新紀元!
求助,關于LT8625SP在LTPOWERCADII V2中的疑問求解
LT8625SP(包含8627 8624 8624)在LTPOWERCADII V2中的模型沒有包含6V以上輸出電壓的各個位置的阻容值的計算,比如輸出電壓大于6
發(fā)表于 04-17 06:46
硅基覺醒已至前夜,聯發(fā)科攜手生態(tài)加速智能體化用戶體驗時代到來
,芯片能力的躍遷都是一切的起點。從率先落地端側AI大模型,到打造天璣AI智能體化引擎,聯發(fā)科一直跑在行業(yè)最前沿。去年發(fā)布的天璣9400不僅端
發(fā)表于 04-13 19:51
軟通計算機重磅發(fā)布DeepSeek大模型一體機產品
。 在人工智能技術加速賦能千行百業(yè)的背景下,隨著AI應用場景的深度拓展,模型部署復雜度高、場景適配難度大、運維成本居高不下等問題日益凸顯,嚴重制約了技術普惠進程。此次,軟通計算機發(fā)布的
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機
的 DGX? 個人 AI 超級計算機。 ? DGX Spark(前身為 Project DIGITS)支持 AI 開發(fā)者、研究人員、數據科學家和學生,在臺式電腦上對大模型進行原型設計、微調和推理。用
發(fā)表于 03-19 09:59
?787次閱讀
微軟OmniParser V2發(fā)布:大模型轉化為計算機智能體
評論