国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

再現輝煌:瑞典國家圖書館運用 AI 解析數百年數據

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2023-02-15 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

瑞典國家圖書館正在使用五百年來的瑞典語文本訓練最先進的 AI 模型,以支持歷史、語言學、媒體研究等方面的人文研究。

從價值連城的中世紀手稿到今天的披薩店菜單,瑞典國家圖書館在過去 500 年中收藏了幾乎所有瑞典語出版物。

由于瑞典法律要求一切瑞典語出版物都要上交副本至瑞典國家圖書館(也稱為瑞典皇家圖書館),因此該圖書館的藏品涵蓋了各清晰度的書籍、報紙、無線廣播、電視廣播、互聯網內容、博士論文、明信片、菜單和電子游戲。這個內容豐富的收藏集含近 26 PB 的數據,是訓練尖端 AI 的最佳選擇。

瑞典國家圖書館數據實驗室 KBLab 的負責人 Love B?rjeson 表示:“我們有最好的數據,所以我們可以構建最先進的瑞典語 AI 模型。”

該團隊使用 NVIDIA DGX 系統開發了二十多個可在 Hugging Face 上使用的開源 Transformer 模型。這些模型推動了圖書館和其他學術機構的研究,每月的開發者下載量多達 20 萬。

B?rjeson 表示:“在我們的實驗室成立前,研究者無法在圖書館訪問數據集,他們每次只能查閱一個對象。因此,為幫助那些需要大量查閱資料的研究者,創建圖書館的數據集十分必要。”

這樣,研究者很快就能創建專門的數據集。例如,調出所有描繪教堂的瑞典明信片、所有特定風格的文本或是所有提到某一歷史人物的書籍、報紙文章及電視廣播。

從圖書館檔案到 AI 訓練數據

瑞典國家圖書館的數據集涵蓋了瑞典語的所有變體,包括各種正式和非正式變體、地區方言以及隨著時間的推移而產生的變化。

B?rjeson 表示:“數據還在持續不斷地涌入并增長,我們每個月都會增加超過 50 TB 的新數據。在處理成倍增長的數據的同時,我們還要將數百年前的實物藏品轉換成數據錄入,所以我們一直在不斷擴大我們的數據集。”

2019 年 KBLab 成立后不久,B?rjeson 就看到了運用龐大的圖書館檔案訓練 Transformer 語言模型的潛力。谷歌早期的多語言自然語言處理模型含有 5GB 瑞典語文本,他從此受到了啟發。

KBLab 的第一個模型使用了谷歌多語言自然語言處理模型 4 倍之多的數據——B?rjeson 團隊的目標是使用至少 1 TB 的瑞典語文本訓練模型。在發現多語言數據集可能提高 AI 的性能之后,這座實驗室開始進行實驗,在其數據集中添加荷蘭語、德語和挪威語內容。

NVIDIA AI 和 GPU 加速模型開發

該實驗室一開始使用的是消費級 NVIDIA GPU,但 B?rjeson 很快發現他的團隊需要數據中心規模的計算來訓練更大的模型。

B?rjeson 表示:“我們意識到在小型工作站上無法完成這項工作,所以 NVIDIA DGX 是明智之選。我們很多的工作離不開 DGX 系統。”

該實驗室使用兩套來自瑞典供應商 AddPro 的 NVIDIA DGX 系統進行本地 AI 開發。這些系統用于處理敏感數據、開展大規模實驗和微調模型。它們還準備在全歐盟搭載 GPU 的大型超級計算機上進行更大規模的運行,其中包括盧森堡的 MeluXina 系統。

B?rjeson 表示:“我們在 DGX 系統上的工作至關重要,因為我們希望能夠在高性能計算環境中做到最好,這必須將超級計算機的作用發揮到極致。”

該團隊還采用了用于訓練大型語言模型的 PyTorch 框架 NVIDIA NeMo Megatron。其內置的 NVIDIA CUDA 和 NVIDIA NCCL 庫可優化 GPU 在多節點系統中的使用。

B?rjeson 表示:“我們十分依賴 NVIDIA 的框架。因為我們實驗室的規模較小,無法派出 50 名工程師優化每個項目的 AI 訓練,NVIDIA 的優勢在這就十分明顯了。”

利用多模態數據開展人文科學研究

除了能夠理解瑞典語文本的 Transformer 模型外,KBLab 還有一個能將聲音轉換成文本的 AI 工具。這使得圖書館能夠將其大量的無線廣播收藏轉換成數據集,以便研究者能夠搜索錄音中的具體內容。

KBLab 還在開發生成式文本模型,同時還在研究一個可以處理視頻并自動生成內容描述的 AI 模型。

B?rjeson 表示:“我們還希望將各種模態的數據聯系起來。當你在圖書館數據庫中搜索一個特定的詞語時,系統將能夠返回包括文本、音頻和視頻在內的結果。”

KBLab 與哥德堡大學的研究者開展了合作。這些研究者正在使用該 KBLab 的模型開發用于語言學研究的下游應用程序。項目之一是幫助瑞典學院升級用于創建瑞典語詞典的數據驅動技術。

B?rjeson 表示:“這些模型的社會效益遠遠超出了我們的最初預想。”

9aac0100-ad07-11ed-bfe3-dac502259ad0.png ? ? ?

點擊“閱讀原文”掃描下方海報二維碼,即可免費注冊 GTC 23,切莫錯過這場 AI 和元宇宙時代的技術大會


原文標題:再現輝煌:瑞典國家圖書館運用 AI 解析數百年數據

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99187

原文標題:再現輝煌:瑞典國家圖書館運用 AI 解析數百年數據

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    UHF RFID通道門圖書館應用12個核心問題全解答

    一、選型基礎篇 1. 圖書館為什么優先選 UHF RFID 通道門,而非高頻(HF)設備? 核心因 UHF 技術更適配圖書館場景:①覆蓋距離優勢,UHF 識別距離可達 0.8-1.2 米,比高
    的頭像 發表于 12-31 15:30 ?334次閱讀

    融智興科技:RFID圖書管理標簽技術解析與智慧圖書館應用

    融智興科技推出高頻RFID圖書管理標簽系列產品。該標簽專為圖書和檔案管理設計,支持高效識別和數據處理。
    的頭像 發表于 12-18 17:23 ?967次閱讀
    融智興科技:RFID<b class='flag-5'>圖書</b>管理標簽技術<b class='flag-5'>解析</b>與智慧<b class='flag-5'>圖書館</b>應用

    OBOO鷗柏丨教學會議一體機圖書館電子白板會議平板前沿科技

    在現代教育和企業環境中,高效的教學和會議工具已成為提升工作效率和教學質量的關鍵。【OBOO鷗柏】作為行業領先的會議教學培訓解決方案提供商,其教學會議一體機、圖書館電子白板及會議平板等產品,以其卓越
    的頭像 發表于 11-19 11:29 ?1275次閱讀
    OBOO鷗柏丨教學會議一體機<b class='flag-5'>圖書館</b>電子白板會議平板前沿科技

    智慧圖書館國產化

    在數字化、智能化的浪潮中,傳統的圖書館正悄然發生著革命性的變化——演變為集閱讀、學習、交流、創新于一體的智慧化公共空間。在這場深刻的變革背后,穩定、高效、安全的計算核心至關重要。向成電子以其
    的頭像 發表于 11-05 10:28 ?405次閱讀
    智慧<b class='flag-5'>圖書館</b>國產化

    PN27G01A-芯片里的“圖書館

    的“備注/備份”,非常適合需要大量數據分區存儲的應用場景。 ? 數據如何找到? 芯片通過12位的“列地址”和16位的“頁/塊地址”,就像在圖書館里用編號精確地定位每一本書,既高效又精準。 性能表現:速度快,效率高 PN27G01
    的頭像 發表于 10-31 08:33 ?263次閱讀
    PN27G01A-芯片里的“<b class='flag-5'>圖書館</b>”

    DEKRA德凱舉行百年慶典 推動可持續發展

    領事Lukas Meyer先生,DEKRA德凱集團首席執行官Stan Zurkiewicz先生,DEKRA德凱集團執行副總裁、亞太區總裁Kilian Aviles博士,DEKRA德凱亞太區高級副總裁、中國大陸及香港董事總經理吳航軍先生,以及近五百位嘉賓、客戶及合作伙伴齊聚一堂,共同回顧百年安全的
    的頭像 發表于 09-14 16:31 ?1548次閱讀

    施耐德電氣助力百年學府數據中心改造升級

    面對不同場景下的“跨時空”能效升級挑戰,施耐德電氣精準施策,以先進的AI技術為核心應用,依托SmartCool末端空調節能解決方案與多種施家硬件設備解決方案的聯合攜手,為這家百年學府的數據中心量身
    的頭像 發表于 08-13 16:47 ?1326次閱讀

    RFID 系統與智能工具柜:重構社康、圖書館與醫療行業的資產管理范式

    在數字化轉型的深水區,基層服務與專業機構的資產管理正面臨效率與安全的雙重考驗:某社康中心每月因疫苗冷鏈記錄疏漏被約談 3 次;某圖書館年度盤點耗費 500 工時,仍有 12% 圖書賬實不符;某醫院
    的頭像 發表于 07-07 16:21 ?650次閱讀
    RFID 系統與智能工具柜:重構社康、<b class='flag-5'>圖書館</b>與醫療行業的資產管理范式

    圖書館WiFi總掉線?我的秘密武器居然是它.

    圖書館阿姨收書還快 ??穩定輸出??:連續3小時查資料,中途只掉線1次(還是因為我手機不小心碰掉了USB) ??無縫銜接??:換IP后不用重新登錄數據庫,連cookie都還在 ??3. 實測對比:蜂鳥IP
    發表于 06-10 18:05

    RFID在圖書館自動化中的應用

    RFID在圖書館自動化中的優勢高效率:RFID可以快速批量讀取圖書信息,大幅縮短借還書時間,提高圖書館管理效率。準確性:RFID減少了人工操作的錯誤率,提高了圖書管理的準確性和可靠性。
    的頭像 發表于 05-27 17:15 ?711次閱讀
    RFID在<b class='flag-5'>圖書館</b>自動化中的應用

    RFID智能書架:圖書館數字化轉型的新核心技術

    隨著數字化轉型的推進,圖書館智能化升級成為趨勢。RFID智能書架憑借高效、精準、自動化的管理能力,成為圖書館現代化轉型的新寵。
    的頭像 發表于 04-28 11:26 ?821次閱讀
    RFID智能書架:<b class='flag-5'>圖書館</b>數字化轉型的新核心技術

    圖書館效率革命!RFID智能書柜如何顛覆傳統借閱體驗?

    傳統借閱體驗繁瑣且低效,圖書館借閱效率亟待提升。RFID智能書柜顛覆傳統借閱體驗,實現圖書精準定位與高效管理。便捷自助借還,縮短借還時間,降低排隊時間,提高借閱體驗。
    的頭像 發表于 04-23 15:21 ?576次閱讀
    <b class='flag-5'>圖書館</b>效率革命!RFID智能書柜如何顛覆傳統借閱體驗?

    RFID圖書管理系統如何重構數字化倉儲管理新生態

    圖書館與出版行業數字化轉型進程中,RFID圖書管理系統正打破傳統人工管理的效率瓶頸,通過與數字化倉儲管理系統的深度融合,實現從圖書采購、入庫到借閱的全鏈路智能化。本文結合RFID固定資產管理軟件的應用邏輯,
    的頭像 發表于 04-18 16:59 ?803次閱讀
    RFID<b class='flag-5'>圖書</b>管理系統如何重構數字化倉儲管理新生態

    智慧閱讀觸手可及——RFID微型圖書館,你了解嗎?

    RFID微型圖書館是一種新型的閱讀模式,通過射頻識別技術構建的小型化、智能化圖書館設施。它提供24小時自助服務、多種登錄方式、圖書定位與查找、快速盤點圖書
    的頭像 發表于 04-09 15:37 ?747次閱讀
    智慧閱讀觸手可及——RFID微型<b class='flag-5'>圖書館</b>,你了解嗎?

    你的樹莓派為什么越用越卡?揭秘SD卡里的&amp;quot;圖書館管理員&amp;quot;

    導語有沒有遇到過樹莓派啟動變慢、運行卡頓,甚至莫名“死機”?這些問題很可能和SD卡里的“隱形管家”——文件系統有關!今天我們將用“圖書館管理員”的比喻,帶你輕松看懂樹莓派啟動流程、文件系統的核心作用
    的頭像 發表于 03-25 09:23 ?1571次閱讀
    你的樹莓派為什么越用越卡?揭秘SD卡里的&amp;quot;<b class='flag-5'>圖書館</b>管理員&amp;quot;