幾個世紀(jì)以來,科學(xué)家們建立和維護(hù)著巨大的植物信息庫,遍布全球的自然歷史博物館和研究機構(gòu)中有著成千上萬的植物標(biāo)本。科學(xué)家們利用這些標(biāo)本對新發(fā)現(xiàn)的植物進(jìn)行識別和分類。近年來隨著標(biāo)本的數(shù)字化,文本、數(shù)據(jù)和圖像變得更易分享和獲取。
如今來自史密斯學(xué)會和哥斯達(dá)黎加理工學(xué)院的研究人員們正致力于更加充分地深入利用這些數(shù)據(jù),將大數(shù)據(jù)分析、計算機數(shù)據(jù)和GPU計算技術(shù)結(jié)合起來,希望更深入地理解植物信息學(xué)。
在深度學(xué)習(xí)幫助下,科學(xué)家們有望大大加速每年的植物分類學(xué)工作效率,傳統(tǒng)的人工分類條件下植物學(xué)家需要對新發(fā)現(xiàn)的物種與已知的40萬種植物作比較,每年能發(fā)現(xiàn)并描述2000種植物。
哥斯達(dá)黎加理工的研究人員與法國國家農(nóng)業(yè)研究中心和法國國家信息與自動化研究所合作研發(fā)出了一種基于圖像識別的深度學(xué)習(xí)算法。他們基于博物館的標(biāo)本數(shù)據(jù)庫訓(xùn)練了一個能根據(jù)圖像數(shù)據(jù)對植物進(jìn)行分類的分類器。
研究人員們用InceptionNet改進(jìn)了新的模型,將Relu單元變?yōu)閰?shù)化的ReLU單元用于避免了模型了過擬合。同時在單元中增加了批量歸一化單元。用于加速網(wǎng)絡(luò)的訓(xùn)練收斂。在使用中每一個batch有16張224*224的圖片作為輸入,并以0.0075的學(xué)習(xí)率進(jìn)行訓(xùn)練。

訓(xùn)練數(shù)據(jù)來自于標(biāo)本數(shù)據(jù)和一系列真實樣本數(shù)據(jù)包括包含214種植物的Herbarium255 數(shù)據(jù)庫,包含一千種植物的PlantCLEF數(shù)據(jù)庫,255種葉片數(shù)據(jù)的CRleaves數(shù)據(jù)庫。通過這些數(shù)據(jù)庫的訓(xùn)練,研究人員們達(dá)到了90%的識別分類準(zhǔn)確率,將傳統(tǒng)需要人工識別比對的工作效率大大提了。
同時史密斯學(xué)會也進(jìn)行了獨立的研究,利用卷積神經(jīng)網(wǎng)絡(luò)對自然歷史信息進(jìn)行數(shù)字化處理,利用深度神經(jīng)網(wǎng)絡(luò)對基于圖像的植物標(biāo)本信息進(jìn)行處理,同時也實現(xiàn)了90%的精度,同時可以以96%的精度區(qū)分形態(tài)學(xué)上極為相似的兩種植物。
這對于植物分類學(xué)的意義重大,意味著植物學(xué)家們可以中耗時最多的比對分類工作中解放出來,迅速提高植物分類學(xué)的研究效率,將大大增加每年新發(fā)現(xiàn)的植物種類,推動一個新的大發(fā)現(xiàn)的時代到來。同時準(zhǔn)確的植物分類結(jié)果是確定生物種群分布的基礎(chǔ),著更有助于保護(hù)區(qū)的劃建和對動植物的保護(hù)。
與此同時史密斯學(xué)會還致力于對水銀處理的追蹤,這是一種早期植物學(xué)家處理植物標(biāo)本防止昆蟲損壞的方式。通過掃面上萬張沾染和非沾染汞的植物樣本照片,使得植物學(xué)家們可以分離出被汞處理過的樣本。
法國農(nóng)業(yè)研究發(fā)展中心隨后研發(fā)出了一個稱為PPl@ntNet的神經(jīng)網(wǎng)絡(luò)并繼承到了手機app中,使的人們可以更加方便的在考察中使用手機快速的對植物進(jìn)行分類采集需要的數(shù)據(jù),而不用像以前一樣采集標(biāo)本送回實驗時進(jìn)行漫長的比對才能確定結(jié)果。
一個小游戲:識別你家的花盆里的植物是啥>>https://identify.plantnet-project.org/
和上述工作類似的是,史密斯學(xué)會建立并維護(hù)的iDigiBio數(shù)據(jù)庫,這是一個龐大的數(shù)據(jù)化生物信息庫,包括生物分布和圖像數(shù)據(jù)以及形態(tài)學(xué)生物學(xué)方面的信息。在未來將逐漸將深度學(xué)習(xí)應(yīng)用在這一數(shù)據(jù)庫上發(fā)揮更大的價值。
目前哥斯達(dá)黎加理工的團(tuán)隊希望在兩個方面繼續(xù)深化這種高效率的生物信息學(xué)。首先他們希望在更多的物種上建立起識別的生物信息庫,將這種識別方式應(yīng)用到昆蟲、鳥類和魚類等物種的發(fā)現(xiàn)鑒別和分類中去。另一方面,他們希望在縱深方向進(jìn)行更深入的發(fā)展,實現(xiàn)從基因?qū)用娴椒N屬方面的自頂向下的全面分類信息。這將會實現(xiàn)全新的生物信息學(xué)并涵蓋更為豐富的信息,達(dá)到更高程度的信息融合.
-
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301454 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124400
原文標(biāo)題:AI與植物學(xué):深度學(xué)習(xí)助力科學(xué)對植物生物多樣性的理解,帶你走進(jìn)神奇的植物世界
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
植物照明持續(xù)火熱:中國軍團(tuán)與全球巨頭的博弈
奇異摩爾受邀出席2025多樣性算力產(chǎn)業(yè)發(fā)展大會
算筆明白賬:換用AC0028S電源芯片后,植物燈系統(tǒng)的TCO竟降低這么多
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用
植物生長燈補光的原理是什么?
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽
植物照明成為產(chǎn)業(yè)新亮點,智能控制領(lǐng)域企業(yè)展現(xiàn)實力
任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?
LED植物生長燈的原理是什么
AI與植物學(xué):深度學(xué)習(xí)助力科學(xué)對植物生物多樣性的理解
評論