国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出1.6萬億參數的人工智能語言模型,打破GPT-3記錄

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-18 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

古諺道:“熟讀唐詩三百首,不會作詩也會吟。” 這句話放在目前的人工智能語言模型中也非常適用。

此前,OpenAI 的研究人員開發出 “GPT-3”,這是一個由 1750 億個參數組成的 AI 語言模型,堪稱有史以來訓練過的最大的語言模型,可以進行原始類比、生成配方、甚至完成基本代碼編寫。

如今,這一記錄被打破了。近日,谷歌研究人員開發出一個新的語言模型,它包含了超過 1.6 萬億個參數,這是迄今為止最大規模的人工智能語言模型,比之前谷歌開發的語言模型 T5-XXL 的規模大了 4 倍。

6735ad0e-584e-11eb-8b86-12bb97331649.png

參數是機器學習算法的關鍵所在,它們是從歷史訓練數據中學習到的模型的一部分。一般而言,在語言領域中參數的數量和復雜度之間的相關性非常好。這一點類似于 GPU晶體管的數量,在同樣的制程工藝下,晶體管越多其算力便越強,而語言模型包含的參數愈多就愈接近人類自然語言。

正如研究人員在一篇論文中指出的那樣,大規模的訓練是通向強大模型的有效途徑,在大數據集和參數計數的支持下,簡單的體系結構遠遠超過了更復雜的算法。但是,有效的大規模培訓在計算上非常密集。這就是為什么研究人員熱衷于他們所說的 “開關變壓器”,這是一種 “稀疏激活” 技術,它只使用模型權重的一個子集或者在模型中轉換輸入數據的參數。

“開關變壓器” 是早在 90 年代初首次提出的一種人工智能模型范例,大體意思是將多個專家或專門處理不同任務的模型放在一個更大的模型中,并有一個 “門控網絡” 來選擇為任何給定數據咨詢哪些專家。

在一項實驗中,研究人員使用 32 個 TPU 內核對幾個不同的 “開關變壓器” 模型進行了預訓練,這些 TPU 內核位于一個從 Reddit、Wikipedia 和其他網絡資源中搜集的 750GB 大小的文本數據語料庫中,任務則是讓這些模型預測段落中 15% 的單詞被遮住的缺失單詞,以及其他挑戰,比如檢索文本來回答一系列越來越難的問題。

研究人員稱,包含了 1.6 萬億參數和 2048 名專家的模型 Switch-C 顯示 “完全沒有訓練不穩定性”。然而,在桑福德問答數據集的基準測試中,Switch-C 的得分居然比僅包含 3950 億個參數和 64 名專家的模型 Switch-XXL 還要低一點,對此,研究人員認為是因為微調質量、計算要求和參數數量之間的不透明關系所致。

在這種情況下,“開關變壓器” 導致了一些下游任務的收益。例如,研究人員稱在使用相同數量的計算資源的情況下,它可以使訓練前的加速速度提高 7 倍以上。他們還證明 “稀疏激活” 技術可以用來創建更小、更密集的模型,這些模型可以對任務進行微調,其質量增益為大型模型的 30%。

對此他們表示:雖然這項工作主要集中在超大模型上,但我們也發現只有兩名專家的模型可以提高性能,同時很容易適應通用 GPU 或 TPU 的內存限制。另外,通過將稀疏模型提取為稠密模型,可以實現 10 到 100 倍的壓縮率,同時獲得專家模型約 30% 的質量增益。

在另一個測試中,“開關變壓器” 模型被訓練在 100 多種不同語言之間進行翻譯,研究人員觀察到 101 種語言的 “普遍改善”,91% 的語言受益于比基線模型快 4 倍以上的速度。未來,研究人員還計劃將 “開關變壓器” 應用于新的領域,比如圖像和文本。他們認為,模型稀疏性可以賦予優勢,在一系列不同的媒體以及多模態模型。

美中不足的是,研究人員的工作沒有考慮到這些語言模型在現實世界中的影響,比如模型通常會放大一些公開數據中的偏見。對此,OpenAI 公司指出,這可能導致在女性代詞附近放置 “淘氣”;而在 “恐怖主義” 等詞附近放置 “伊斯蘭” 等。根據米德爾伯里國際研究所的說法,這種偏見可能被惡意行為者利用,通過散布錯誤信息、造謠和謊言來煽動不和。

而路透社也曾報道稱,谷歌的研究人員現在被要求在研究人臉和情緒分析以及種族分類等話題之前,先咨詢法律、政策和公關團隊,性別或政治派別。

綜上所述,盡管谷歌訓練的 1.6 萬億參數的人工智能語言模型還沒辦法做到真正意義上的人工智能,存在一些不足之處需要完善和優化,但隨著在摩爾定律下電子設備算力的不斷提升,近些年 AI 語言模型參數量級呈指數倍發展,相信在不久的將來,或許真的會出現一個無限接近熟讀人類歷史所有文明記錄的超級模型,能夠和人類完全實現自然語言交流,不妨讓我們好好期待一下吧!

原文標題:GPT-3記錄被打破!谷歌推出1.6萬億參數的人工智能語言模型

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111391
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265372

原文標題:GPT-3記錄被打破!谷歌推出1.6萬億參數的人工智能語言模型

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    GPT-5震撼發布:AI領域的重大飛躍

    躍升重新定義了人工智能的能力邊界。OpenAI首席執行官山姆·奧特曼在發布會上直言:“這不僅是模型的升級,更是通往通用人工智能(AGI)的關鍵里程碑。” ? ? GPT-5:集成
    的頭像 發表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發布:AI領域的重大飛躍

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發表于 02-22 08:24 ?120次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    什么是大模型智能體...?大模型100問,快速全面了解!

    一、概念篇1.什么是大模型?大模型是指參數規模巨大(通常達到數十億甚至萬億級別)、使用海量數據訓練而成的人工智能
    的頭像 發表于 02-02 16:36 ?892次閱讀
    什么是大<b class='flag-5'>模型</b>,<b class='flag-5'>智能</b>體...?大<b class='flag-5'>模型</b>100問,快速全面了解!

    人工智能應用開發-中級(大模型)》認證證書含金量如何?怎么考?

    ,且能完成智能體系統設計與任務編排的工程師備受企業青睞。《人工智能應用開發-中級(大模型)》專業技術人才培訓授證項目正是為應對這一趨勢推出,項目依托中國電子學會“
    的頭像 發表于 01-28 15:11 ?705次閱讀
    《<b class='flag-5'>人工智能</b>應用開發-中級(大<b class='flag-5'>模型</b>)》認證證書含金量如何?怎么考?

    上海交大發布國產光學大模型Optics GPT

    電子發燒友網綜合報道 1月25日,上海交通大學正式推出光學領域垂直大語言模型——Optics GPT(光學大模型),這是一款完全自主研發的國
    的頭像 發表于 01-26 09:59 ?1118次閱讀
    上海交大發布國產光學大<b class='flag-5'>模型</b>Optics <b class='flag-5'>GPT</b>

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進一步擴展了 Gemini 3 模型系列。
    的頭像 發表于 01-22 16:04 ?478次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發人員意味著什么,以及使用 Neuton 模型如何改進您的開發和終端
    發表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發表于 07-31 11:38

    人工智能技術的現狀與未來發展趨勢

    人工智能技術的現狀與未來發展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發展,深刻影響著各行各業。從計算機視覺到自然語言處理,從自動駕駛到醫療診斷,AI的應用場景不斷擴展,推動社會向智能
    的頭像 發表于 07-16 15:01 ?1867次閱讀

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的
    發表于 07-04 11:10

    如何借助大語言模型打造人工智能生態系統

    、硬件需求以及所涉及的財務影響這三者之間的內在聯系。我們將深入探究現實中大語言模型的發展趨勢,并共同探討如何借助規模更小、效能更高的模型,打造一個更具可持續性的人工智能生態系統。
    的頭像 發表于 04-27 09:19 ?1084次閱讀
    如何借助大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>打造<b class='flag-5'>人工智能</b>生態系統

    Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI智能體、定制化行業大型語言
    的頭像 發表于 03-26 14:42 ?742次閱讀
    Cognizant將與NVIDIA合作部署神經<b class='flag-5'>人工智能</b>平臺,加速企業<b class='flag-5'>人工智能</b>應用

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結合視覺(圖像/視頻)和語言(文本)處理能力的多模態人工智能模型
    的頭像 發表于 03-17 15:32 ?8843次閱讀
    ?VLM(視覺<b class='flag-5'>語言</b><b class='flag-5'>模型</b>)?詳細解析