據《科學》(Science)雜志2017年10月報道,一家名為Vicarious的人工智能公司開發的人工智能算法攻破了被人們廣泛使用的CAPTCHAs驗證碼。
CAPTCHAs(Completely Automated Public Turing Test To Tell Computers and Humans Apart,全自動區分計算機和人類的圖靈測試)是目前最常用的一種驗證碼,通常由一組混亂的字符、波浪線和其他背景噪聲組成。例如,在你報名參加一個時事通訊或購買音樂會門票之前,可能會被要求輸入這些字符。
科學家稱,他們已經開發出一種計算機模型,能從根本上攻破CAPTCHAs驗證碼。
有很多種方法可以將字母呈現并混合在一起,人們通常可以很直觀的讀出來,但對計算機來說卻很難。破解驗證碼的能力已經成為評判人工智能研究人員的一個重要基準。
許多人嘗試過并獲得了一些成功。例如,10年前Ticketmaster公司起訴了一家科技公司,因為對方能夠繞過該公司的驗證碼系統大規模地購買音樂會門票。但人工智能公司Vicarious的聯合創始人迪利普·喬治(Dileep George)說道,之前的一些嘗試只是利用了一種特殊的驗證碼弱項,而程序的細微變化就可以很容易地對它進行防御。Vicarious公司在《科學》雜志上發表了一項新模型,它通過較少的訓練就可以比以前的模型更有效地解析文本,從而能從根本上打破驗證碼的防御系統。
喬治說,以前的模型試圖讓機器能像人類一樣學習,這在很大程度上依賴于一種叫做深度學習的主流人工智能技術。“深度學習是這樣一種技術,你有多層神經元,然后你訓練這些神經元按照你的方式做出反應。”他說。例如,你可以通過成千上萬次地展示字母A和B的示例圖片來訓練一臺機器識別字母A和字母B。即使是這樣,它也很難識別出字母A與B的重疊,除非它已經明確地接受了重疊圖片的訓練。“它只復制了人腦工作的一些方面。當然,我們能夠從案例中學習。但是人腦不需要把每個字符看很多次來重新認識它,例如大腦會識別出字母A,即使它更大或是傾斜的。”
喬治的團隊使用了一種被稱為遞歸皮層網絡(Recursive Cortical Network)的不同方法,他說,即使缺乏訓練,該方法也能更好地推理出它所看到的東西。“我們發現,大腦對視覺世界做出了一些假設,而神經網絡(深度學習)卻沒有”。以下是他們新方法的工作原理:
在訓練階段,新方法建立了它所接觸字母的內部模型。因此,如果你向它展示大量的A、B等不同的字符,針對這些字符應該是什么樣的,它將建立起自己的內部模型。所以它將顯示:這是字母的輪廓,這是字母的內部結構,這是背景,等等。然后,當一個新的圖像出現,它會試著解釋新圖像,并用它以前見過的字符來解釋新圖像的所有像素。所以它會說,A的這部分缺失了是因為它在B的后面。
驗證碼有很多種。根據本論文,新方法的模型“解決驗證碼相關問題的正確率達66.6%……,計算機檢測正確率為64.4%,雅虎為57.4%,貝寶(全球最大的在線支付平臺)則是57.1%。
然而,這項研究的重點實際上與驗證碼無關,而是關于如何制造看上去能像人類一樣推理的機器人。“我們的長期目標是打造像人腦一樣思維的智力。”喬治說,“驗證碼對我們來說只是一個很自然的測試,因為通過這個測試,你可以檢查你的系統是否能像大腦一樣工作。”機器人需要了解它周圍的世界,能夠用物體和操作物體進行推理。這些案例只需要較少的訓練樣本,卻能以非常靈活的方式面對世界,并且都能進行推理,所以非常重要;而且這些案例也是我們正在應用的領域。
有些人對機器人將具備類似人類能力而感到不安,對此他的回答概括起來就是:“這將是技術的發展。至于計算機未來能夠像人腦一樣工作,我們將不得不視其為理所應當的趨勢。”
目前還不清楚這項研究對信息安全的影響有多大。喬治指出,谷歌已經從文本驗證碼轉移到了更高級的測試。隨著人工智能變得越來越智能,證明用戶是人的測試也將變得更加智能。
-
人工智能
+關注
關注
1818文章
50132瀏覽量
265729
原文標題:CAPTCHAs驗證碼被人工智能攻破
文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Questa One 智能驗證:釋放人工智能在功能驗證中的潛力
開發智能體配置-內容合規
自然智能與人工智能融合如何重塑芯片設計
【產品介紹】Altair RapidMiner數據分析與人工智能平臺
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
自動化測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰指南!
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
視頻分析系統在化工廠應用的算法通常有哪些?
人工智能算法攻破CAPTCHAs驗證碼的案例分析
評論