近兩年人工智能發(fā)展迅猛,各種應(yīng)用層出不窮,但其質(zhì)量卻是良莠不齊。原因在于大部分測試童鞋還在用傳統(tǒng)的測試方式也就是通過界面和功能對人工智能軟件進(jìn)行測試,但是AI軟件從開發(fā)到測試都很不同于傳統(tǒng)軟件,本文就以智能文本分類系統(tǒng)為例通過兩步來介紹為何傳統(tǒng)的測試方法不能保證AI軟件的質(zhì)量。
一、第一步------------人工智能軟件測試的痛點
目標(biāo)
掌握人工智能軟件測試面臨的現(xiàn)實痛點
步驟
1.智能文本分類系統(tǒng)是AI自然語言處理的一個基本應(yīng)用,界面如下圖所示
2.對其測試時需要根據(jù)不同的輸入點擊獲取標(biāo)簽得出所屬的類別以及所屬類別的概率值
3.通過功能和界面進(jìn)行測試的話需要輸入各種可能輸入的文本,耗時巨大,并且也不太現(xiàn)實
4.從界面上對得到的score代表的概率值進(jìn)行判斷無法得出一個客觀的評判,這個值多少合適判斷不了
5.因此傳統(tǒng)界面和功能測試完了判斷不了智能文本分類系統(tǒng)能否上線
二、第二步----------------AI軟件測試的正確方式
目標(biāo)
掌握AI軟件測試的正確方式
步驟
1.了解AI軟件測試的本質(zhì)
人工智能軟件是根據(jù)算法對大量的數(shù)據(jù)進(jìn)行訓(xùn)練找規(guī)律,最終得出一個模型來對新的數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測的時候會給出一個概率值。
2.AI軟件測試的正確方式
通過實現(xiàn)人工智能算法自帶的評測指標(biāo)來進(jìn)行AI軟件的測試可以很好的評估軟件的質(zhì)量,完美解決窮舉各種輸入和概率值大小的現(xiàn)實問題
3.通過AI模型測試的具體評測指標(biāo)
以智能文本分類為例,其采用了監(jiān)督示機(jī)器學(xué)習(xí)的分類算法,對應(yīng)的評測指標(biāo)有:
準(zhǔn)確率、精確率、召回率
總結(jié)
本文通過智能文本分類系統(tǒng)面臨的測試難點來指出AI軟件測試過程中的通用難題。以此指出了通過功能和界面測試人工智能軟件不能保證AI軟件的質(zhì)量,正確的方式應(yīng)該是通過實現(xiàn)AI軟件算法自帶的評測進(jìn)行進(jìn)行測試
-
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301382 -
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265322
發(fā)布評論請先 登錄
半導(dǎo)體嵌入式單元測試的核心技術(shù)、工具選型與落地全流程
汽車軟件質(zhì)量躍遷的系統(tǒng)性路徑:基于ISO 26262標(biāo)準(zhǔn)的單元測試體系重構(gòu)與中日實踐深度對比(2026學(xué)術(shù)研究報告)
嵌入式軟件單元測試中AI自動化與人工檢查的協(xié)同機(jī)制研究:基于專業(yè)工具的實證分析
嵌入軟件單元測試的全面研究與實踐
如何通過ATE測試設(shè)備優(yōu)化產(chǎn)品質(zhì)量?
融合AI的OpenHarmony應(yīng)用軟件開發(fā):ai學(xué)習(xí)自律輔助軟件
新能源汽車質(zhì)量保證體系與傳統(tǒng)汽車單元測試規(guī)范的融合研究
潤和軟件旗下捷科中標(biāo)江蘇銀行AI移動端自動化功能測試建設(shè)項目
電源模塊的短路保護(hù)如何通過自動化測試軟件完成測試
即時通話軟件音頻傳輸質(zhì)量測試方案介紹
國產(chǎn)電源模塊測試軟件功能應(yīng)用全面解析
自動化測試平臺ATECLOUD推出AI算法功能
大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?
蔡司質(zhì)量軟件生態(tài)體系賦能數(shù)字化轉(zhuǎn)型 | WHAT’S NEW軟件新功能系列發(fā)布會南京站圓滿落幕
通過界面和功能測試不能保證AI軟件的質(zhì)量
評論