国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AppAgent讓移動App應用測試更輕松

vliwulianw ? 來源:軟件質量報道 ? 2023-12-26 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AppAgent 的創新技術值得我們測試人員的關注。

最近大語言模型(LLMs)的進展導致了智能代理(Agent)的創建,這些代理能夠執行復雜的任務。而由騰訊團隊開發的AppAgent, 其智能代理能力可以用于操作任何 App,它在 50 個復雜手機任務上展示了強大的能力。

這項技術通過引入一種基于大型語言模型(LLMs)的多模態智能代理(Agent)框架,賦予了智能體操作智能手機應用的能力。與傳統的智能助手如 Siri 不同,AppAgent 不依賴于系統后端訪問,而是通過簡化的操作空間來操作智能手機應用程序,可以模擬人類的點擊和滑動等操作,直接與手機應用的圖形用戶界面(GUI)互動。這種獨特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應應用界面的變化和更新,從而擴大了它在各種應用程序中的適用性。

AppAgent 的核心在于其創新的學習方式,智能體可以通過自主探索或觀察人類演示來學習如何導航和使用新應用。在自主探索過程中,。這個過程還可以通過觀察少數幾個人類演示來加速,使智能體能夠更快地理解復雜功能。

AppAgent分為兩個階段,分別稱為探索階段和部署階段。在自主探索階段,AppAgent智能體通過一系列預定義的動作與應用互動,觀察不同應用程序的用戶界面交互(每個動作帶來的界面變化),AppAgent與智能手機應用程序進行交互,并從結果中學習,所學到的知識被精心編制成文件(構建知識庫)。一旦這個學習階段完成,AppAgent變得擅長使用應用程序,就準備好行動了,即在探索階段之后的部署階段,AppAgent利用編制在此文檔中的信息來高效地操作和導航應用程序,完成不同應用程序中的各種復雜任務。

ab92392a-a217-11ee-8b88-92fbcf53809c.png

(圖1 框架的兩階段方法:探索階段和部署階段)

為了驗證其實用性,研究團隊對 AppAgent 進行了廣泛測試,覆蓋了社交媒體、電子郵件、地圖、購物以及復雜的圖像編輯工具等 10 種不同的應用中的 50 個任務。測試結果證明,AppAgent 在處理各種高級任務方面表現出色,顯示出其適應性、用戶友好性以及高效的學習和操作能力。

1.實驗環境

實驗環境建立在Android操作系統的命令行界面(CLI)上,允許AppAgent與智能手機應用程序進行交互。代理接收兩個關鍵輸入:顯示應用程序界面的實時截圖和詳細的交互元素的XML文件。為了增強AppAgent識別和無縫交互這些元素的能力,我們為每個元素分配了一個唯一的標識符。這些標識符要么來自XML文件中的資源ID(如果提供),要么是通過組合元素的類名、大小和內容構建而成。這些元素以半透明的數字疊加在截圖上。這有助于AppAgent在不需要指定屏幕上精確位置的情況下準確交互,并增強了AppAgent在控制手機時的精度。

行動空間:AppAgent的行動空間反映了人們在智能手機上的常見交互方式:輕觸和滑動,設計了四種基本功能,并用到Android的兩個系統級的操作:

Tap(element : int):這個函數模擬對屏幕上標有數字的UI元素進行輕觸。例如,tap(5)將點擊標有“5”的元素。

Long_press(element : int):這個函數模擬對UI元素進行長按(1秒)。

Swipe(element : int, direction : str, dist : str):在指定方向(上、下、左、右)和距離(短、中、長)上滑動一個元素。例如,swipe(21, "up", "medium")將在元素“21”上向上滑動一段中等距離。

Text(text : str):為了繞過低效的虛擬鍵盤輸入,這個函數在虛擬鍵盤可見時直接將文本輸入到輸入框中。例如,text("Hello, world!")輸入字符串“Hello, world!”。

Back():系統級功能,幫助代理返回到前一個UI頁面,特別適用于退出不相關頁面。

Exit():特地的函數用于結束進程,通常在成功完成任務時調用。

這些預定義的動作旨在簡化AppAgent的交互,特別是通過消除對精確屏幕坐標的需求,這對于大語言模型(LLM)準確預測來說可能會帶來挑戰。

2. 探索階段

探索階段是這個框架的核心。

在此階段,AppAgent被分配一個任務,并開始自主與UI元素進行交互,通過試錯學習智能手機應用程序的功能和特性

AppAgent使用不同的動作,并觀察應用界面的變化,以了解其工作原理。由LLM驅動的AppAgent試圖通過分析每個動作之前和之后的截圖來弄清楚UI元素的功能和特定動作的影響。這些信息被編制成一個記錄了對不同元素應用的動作效果的文檔。

當一個UI元素被多次操作時,AppAgent將根據過去的文檔和當前觀察更新文檔以提高質量。為了使探索更加高效,如果當前UI頁面似乎與應用的主要任務無關,如廣告頁面,AppAgent將停止進一步探索UI元素。在這種情況下,它使用Android系統的Back()函數返回到前一個UI頁面。

與隨機探索(如深度優先搜索和廣度優先搜索)相比,這種目標導向的探索方法確保代理專注于對應用程序有效操作至關重要的元素。AppAgent還利用LLM對用戶界面的現有知識來提高探索效率。當AppAgent完成分配的任務時,探索停止。

通過觀看演示進行探索。另一種常見且通常更有效的探索方法涉及AppAgent觀察人類示范。這些演示為代理提供了高效使用應用程序的示例,特別是對于理解可能通過自主交互難以發現的復雜功能。在這種方法中,一個人類用戶操作應用程序,而AppAgent觀察并記錄人類使用的元素和動作。這種策略縮小了探索空間,防止代理與無關的應用頁面進行交互,使其與自主交互相比成為更加簡化和高效的方法。

3. 部署階段

在探索階段之后,代理已經具備了執行復雜任務的能力,這是基于其積累的經驗。當給定任務時,代理遵循一種逐步的方法,每一步都包括對當前UI截圖的訪問和動態生成的文檔,詳細說明了UI元素的功能以及動作對當前UI頁面的影響。提示還提供了所有可用動作的詳細解釋。

在每一步中,代理首先被要求提供對當前UI的觀察,然后闡述其對任務和當前觀察的思考過程。隨后,代理開始執行動作,調用可用的函數。在每個動作之后,代理總結了交互歷史和當前步驟中所采取的動作。這些信息被納入下一個提示中,為代理提供了一種記憶形式。這種細致的方法增強了代理行動的可靠性和可解釋性,從而促進了更明智的決策制定。當代理確定任務已經完成時,部署階段停止,此時它可以通過執行Exit()動作退出流程。

aefef242-a217-11ee-8b88-92fbcf53809c.gif









審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GUI
    GUI
    +關注

    關注

    3

    文章

    697

    瀏覽量

    43463
  • XML技術
    +關注

    關注

    0

    文章

    15

    瀏覽量

    6195
  • CLI
    CLI
    +關注

    關注

    1

    文章

    80

    瀏覽量

    9051

原文標題:震撼:AppAgent讓移動App應用測試更輕松

文章出處:【微信號:軟件質量報道,微信公眾號:軟件質量報道】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    動態血糖儀如何疾病監測更輕松便捷

    動態血糖儀無需指尖采血,即可提供實時血糖數據,有助于改善糖尿病管理。
    的頭像 發表于 02-25 10:42 ?681次閱讀
    動態血糖儀如何<b class='flag-5'>讓</b>疾病監測<b class='flag-5'>更輕松</b>便捷

    AI智能眼鏡會生活更輕松

    科技行業長期以來都在構想一個增強型世界,即數字與物理能夠無縫融合,用戶在不被拉離當下現實的情況下,依然保持對真實世界的專注。然而,能夠真正將這一愿景落地的理想硬件與技術組合,至今仍未出現。
    的頭像 發表于 02-05 14:57 ?874次閱讀

    風電變槳系統故障多?振動監測 + 遠程調參

    未來,隨著數字孿生、AI 診斷等技術的融合,風電場智能化水平還將持續升級,故障少發生、運維更輕松
    的頭像 發表于 11-25 10:00 ?609次閱讀
    風電變槳系統故障多?振動監測 + 遠程調參

    Flutter 移動端開發:集成淘寶 API 實現商品數據實時展示 APP

    在電商蓬勃發展的當下,移動端購物成為主流趨勢。對于開發者而言,利用 Flutter 構建一個能夠實時展示淘寶商品數據的 APP,既能滿足用戶便捷獲取商品信息的需求,也能為電商業務拓展新的渠道
    的頭像 發表于 11-13 09:36 ?366次閱讀

    智能覆冰在線監測裝置,冬日巡線更輕松!

    在線監測
    jf_96960730
    發布于 :2025年10月21日 10:55:48

    告別測量煩惱!蔡司硬件升級,效率與輕松同行

    硬核硬件升級方案來了 從操作到效率全方位“開掛” 測量工作從此輕松又高效 無線移動小車 擺脫線纜束縛,測量靈活又安心 誰能想到,一個小小的移動小車能解決測量中的大麻煩? 以前用傳統遠
    的頭像 發表于 09-26 17:18 ?1485次閱讀
    告別測量煩惱!蔡司硬件升級,<b class='flag-5'>讓</b>效率與<b class='flag-5'>輕松</b>同行

    如何大模型生成你想要的測試用例?

    應用大模型生成測試用例,常見的知識庫,測試大模型,微調,RAG等技術門檻都不低,甚至很難,因此對于應用者而言,最快的方式就是應用好提示詞,調教屬于個人風格的測試用例智能生成模塊,智能
    的頭像 發表于 09-26 10:01 ?944次閱讀
    如何<b class='flag-5'>讓</b>大模型生成你想要的<b class='flag-5'>測試</b>用例?

    推薦5個測試效率翻倍的MCP

    推薦5個測試效率翻倍的MCP
    的頭像 發表于 09-19 10:02 ?629次閱讀
    推薦5個<b class='flag-5'>讓</b><b class='flag-5'>測試</b>效率翻倍的MCP

    實時監控與診斷,EtherCAT網絡管理更輕松

    上期我們探討了AWStudio運動控制版的EtherCAT配置功能,這期我們將聚焦于其強大的診斷與監控工具,看看它是如何幫助開發者實時掌握網絡狀態并快速定位問題的。AWStudio運動控制版AWStudio運動控制版提供了實時監控功能,能夠實時顯示EtherCAT網絡的運行狀態,包括從站設備的通信狀態、數據交換情況等,這有助于開發者及時發現并解決網絡中的潛在
    的頭像 發表于 08-28 11:36 ?721次閱讀
    實時監控與診斷,<b class='flag-5'>讓</b>EtherCAT網絡管理<b class='flag-5'>更輕松</b>!

    安科瑞園區解決方案:綠電直連更高效,低碳管理更輕松

    安科瑞
    jf_459710037
    發布于 :2025年07月18日 16:48:37

    HarmonyOS 代碼工坊的指尖開發, APP 開發所見即所得

    過去,移動APP 的開發,往往是開發者在桌面仿真界面上的一場“隔空演練”。 雖然市面上已經有一些簡化開發的工具,可以在開發桌面提供模擬移動端效果的窗口,但終究不是真實的移動端設備。
    的頭像 發表于 06-24 12:08 ?827次閱讀
    HarmonyOS 代碼工坊的指尖開發,<b class='flag-5'>讓</b> <b class='flag-5'>APP</b> 開發所見即所得

    通過御控APP實現PLC遠程調試與遠程監控

    御控APP,通過移動化、智能化的手段,實現了PLC遠程調試與監控,為工業生產帶來了便捷與高效。
    的頭像 發表于 06-04 09:49 ?627次閱讀

    【HarmonyOS 5】App Linking 應用間跳轉詳解

    ![](<> \"點擊并拖拽以移動\")? 如何開發 開發前注意事項:使用 App Linking 需使用手動生成簽名,自動簽名將無法啟動應用。 1.開通 App
    發表于 05-16 16:24

    APP自動化測試框架

    APP自動化測試框架是一套結合工具鏈、設計模式和技術規范的集成解決方案。以下是基于主流技術實踐的核心要點總結: 一、核心模塊構成 環境管理? 支持物理機/虛擬機/容器化部署,集成ADB、Appium
    的頭像 發表于 05-07 07:35 ?665次閱讀
    <b class='flag-5'>APP</b>自動化<b class='flag-5'>測試</b>框架

    光伏智慧運維系統電站自己說話和思考

    出錯。光伏智慧運維系統就是給這個大家族裝上了眼睛、耳朵和大腦,它能自己說話和思考,管理變得更輕松、更聰明。 ?????? 一、它是什么? ?????? 光伏智慧運維系統就像一個智能管家,通過安裝在電站里的傳感器、攝像頭、數據
    的頭像 發表于 03-27 17:01 ?797次閱讀
    光伏智慧運維系統<b class='flag-5'>讓</b>電站自己說話和思考