国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI大模型帶來改變,將加速通用人工智能的實現!

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-02-28 01:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)近日,百度飛槳總架構師于佃海公開談到,AI預訓練大模型是深度學習崛起以來,最重要的一次技術變革。

大模型不只是模型參數規模大,同時也對應著學習機制和AI開發應用范式的改變。自監督學習模式突破了數據標注的困境,可以從海量數據中學習到豐富的通用知識。

基于大模型,只需要通過模型的微調或提示等方式,就可以在廣泛的下游任務中取得優異的效果,極大的降低了AI開發和應用的成本。

大語言模型的涌現能力

在自然語言處理領域,過去這些年模型的規模越來越多。之前模型參數大概在千萬級別、億級別,現在已經跳到了千億級別。基本上游研究這些大模型的使一些計算資源比較豐富的企業和機構,有了這些預訓練模型之后,下游可以把它放在一些自然語言處理的任務中。

在全球人工智能開發者先鋒大會上,復旦大學計算機學院教授邱錫鵬在《ChatGPT能力分析與應用》主題演講中表示,大型語言模型是ChatGPT的基座。

邱錫鵬教授談到,當模型從小規模發展到大規模的時候,當發展到一定階段,它會涌現出一些之前在小模型上觀測不到的能力,也就是大家說的能力涌現。比如給幾個樣例,讓模型學習這個任務,一個百億級別參數規模的模型和一個千億級別參數的模型,這兩個模型的能力差異會相當大,邱錫鵬教授認為,從百億到千億參數規模,模型發生了能力的突變。

考察大模型的幾個能力:數學建模能力、多任務理解的能力、上下文的學習理解能力,在百億規模之后,就會發生突變。它的能力不再是線性增長。

模型使用的方式也發生了變換,因為有了大模型之后,調參非常難,它的使用范式也會發生變化。比如,早期使用預訓練,調它的參數;現在語言模型很大的時候,要做什么任務,就是提示,告訴它要做什么,變成了另外一種使用范式。

舉個例子,我們把要完成的任務,用一句話描述出來,輸入給語言模型,語言模型就按產生下一句話的方式,生成你要的答案。這就是大型語言模型的使用方式。邱錫鵬教授認為,在Transformer這種架構下,大型語言模型標志性的分水嶺是百億規模參數。

以ChatGPT為例,在大模型下,ChatGPT涌現出的三種能力:情景學習、思維鏈和指令學習。這三個能力對ChatGPT最終的成功起到了重要作用。

情景學習:大模型調參不是很方便,如果要它在一個上下文語境中完成學習,這就叫情景學習。也就是給它一個任務,再給它幾個例子,讓它學習。情景學習賦予了大模型非常強的交互能力,情景學習也可以大幅降低下游的開發成本。

思維鏈:思維鏈的關鍵是打破了Scaling Law,一般而言,模型規模的放大通常會帶來能力的提升。而思維鏈的出現,使得在一定規模之后,可以通過思維鏈繼續放大模型的能力,而不需要進一步擴大參數規模。

指令學習:大模型達到一定規模之后,只需要給它少數的指令,它就學會了,對于沒見過的指令,它也會。這些就是大模型的涌現能力,它的泛化能力會變得非常強。

文圖生成主要技術路線

在ChatGPT出現之前,大模型最火的應用就是AI作畫,也就是文圖生成。事實上,文圖生成技術從2015年到現在,一直在不斷演進。據百度深圳自然語言處理部技術總監何徑舟在上述大會上介紹,這之間,文圖生成技術大概經歷了三個技術流派。

pYYBAGP8gCWAHRp6AAY-E2gURYU767.png

第一個是以對抗生成網絡GAN-based為主的早期技術;第二個是序列生成 VQ-token-based這種方式 ;第三個是從去年開始大熱的Diffusion-based擴散網絡這種方案?,F在常見的、在很多產品中使用的,都是這三個技術流派的延續或結合。

基于GAN的文本-圖像生成模型,是四五年前最火的文圖生成技術。它的優點是,整個模型的生成過程很快,在當時來看,生成的圖像質量相當不錯;然而它致命的缺點是,網絡特別難訓練,稍不小心就會訓練壞,或者難以得到理想的效果。因此在之后的工作中,大家就不太實用了。

基于圖像量化的序列建模。它是把圖像基于離散化的方式,壓縮成離散視覺token的序列,這樣可以跟文本用類似的方式基于Transformer自回歸生成,建模文本序列和圖像序列間的關系。通過這樣的方式,做文圖轉換,也可以做圖像文本的生成。何徑舟表示,文心大模型ERNIE-ViLG第一個版本就是基于VQ-token-based這種方式做的,在當時ERNIE-ViLG能夠完成雙向的生成和建模。

基于擴散模型的文本-圖像生成模型,是現在文圖生成技術的主流。它是把一個圖像通過加高斯噪聲的方式,一直到純隨機序列高斯噪音的分布。再通過UNet,不斷反復調用它,把這個圖像還原回來。這時候可以把文本的encoder加進去,指導圖像還原過程。這樣就實現了從文本到圖像的生成過程。這是現在絕大多數最新產品和技術都采用的方案,效果非常好。

小結

過去這些年,國內外在大模型技術的研究方面不斷取得突破,最近ChatGPT的出現及其體現出的驚人能力,更是讓人們體會到了大模型對于人工智能發展的重要意義。從種種跡象來看,疊加情景學習、指令微調、人類反饋、強化學習等機制,可以使大模型實現超出想象的能力涌現,讓人們期待的通用人工智能的實現加速。



聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39808

    瀏覽量

    301479
  • 大模型
    +關注

    關注

    2

    文章

    3651

    瀏覽量

    5191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    。 強人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發表于 02-22 08:24 ?134次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    聲智科技助力第一屆產學結合高校通用人工智能大賽決賽圓滿落幕

    通用人工智能(AGI)浪潮席卷全球,如何縮短前沿算法與產業應用之間的距離?本周一,第一屆產學結合高校通用人工智能大賽(AGIUC)決賽圓滿落幕。作為賽事官方支持單位,聲智科技深度參與賽題設計、算力
    的頭像 發表于 02-01 10:27 ?821次閱讀

    【艾為視角】保證大方向正確!利用人工智能解決一線實際問題

    保證大方向正確,加快迭代,小步快跑。聚焦內部效率提升,利用人工智能改變作業模式、簡化管理,結合業務場景解決一線實際問題?!慰傇贕TS人工智能實踐進展匯報會上的講話1聚焦內部效率提升,利用人
    的頭像 發表于 09-26 19:03 ?687次閱讀
    【艾為視角】保證大方向正確!利<b class='flag-5'>用人工智能</b>解決一線實際問題

    云天勵飛亮相2025深圳通用人工智能大會

    近日,以“模驅具身?智啟未來”為主題的2025 AGIC深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會(以下簡稱大會)在深圳國際會展中心(寶安)開幕。
    的頭像 發表于 09-01 14:09 ?937次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們介紹這對開發人員意味著什么,以及使用 Neuton 模型如何改進您的開發和終端
    發表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文
    發表于 07-31 11:38

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能
    發表于 07-14 11:23

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在一些網絡條件受限或對數據隱私有較高要求的
    發表于 07-04 11:14

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的
    發表于 07-04 11:10

    中軟國際科創中心上線阿里Qwen3-235B模型

    近日,中軟國際科創中心快速部署阿里Qwen3-235B模型并完成測試,為客戶提供 AI 項目POC的模型新選擇,助力企業快速實現智能化轉型,
    的頭像 發表于 05-12 15:40 ?1105次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發表于 04-23 10:55

    星漢大模型2.0:AI模型浪潮奔涌 大華股份呈交“智能答卷”

    2025年,全球人工智能技術迎來了前所未有的“奇點時刻”。DeepSeek等通用模型的蓬勃興起,極大地加速AI從“實驗室”向“生產線”的
    的頭像 發表于 04-03 16:32 ?996次閱讀
    星漢大<b class='flag-5'>模型</b>2.0:<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>浪潮奔涌 大華股份呈交“<b class='flag-5'>智能</b>答卷”

    Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用

    -Cognizant將與NVIDIA合作部署神經人工智能平臺,加速企業人工智能應用 Cognizant將在關鍵增長領域提供解決方案,包括企業級AI
    的頭像 發表于 03-26 14:42 ?746次閱讀
    Cognizant將與NVIDIA合作部署神經<b class='flag-5'>人工智能</b>平臺,<b class='flag-5'>加速</b>企業<b class='flag-5'>人工智能</b>應用