国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

度曉曉1秒1篇高考作文,都是因為預訓練大模型

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2022-06-10 00:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)6月7日,百度推出的數字人度曉曉作答了全國新高考Ⅰ卷題為《本手、妙手、俗手》議論文,40秒就根據題目創作了40多篇文章,平均1秒生成1篇,隨機抽取其中一篇,其分數趕超約75%高考考生。


而這得益于文心大模型最新發布的融合任務相關知識的千億大模型ERNIE 3.0 Zeus,該模型在學習海量數據和知識的基礎上,進一步學習百余種不同形式的任務知識,增強了模型的效果,在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。

基于文心大模型的智能創作

大模型是人工智能大基礎設施的重要組成,“文心大模型”是百度近幾年在花大力氣投入研發的技術基礎設施。自2019年開始,百度深耕預訓練模型研發,并在該年3月率先發布中國首個正式開放的預訓練模型ERNIE1.0。

去年12月,百度聯合鵬城實驗室發布了鵬城-百度·文心大模型,這是全球首個知識增強千億大模型,也目前全球最大中文單體模型,參數規模達到2600億。

在今年5月20日的WAVE SUMMIT 2022深度學習開發者峰會上,文心大模型一次性發布10個新的大模型,涵蓋基礎大模型、任務大模型和行業大模型三級體系,其中就包括融合任務相關知識的千億NLP大模型ERNIE 3.0 Zeus。

千億規模參數的NLP基礎大模型ERNIE 3.0 Zeus在學習海量數據和知識的基礎上,進一步學習百余種不同形式的任務知識,增強模型效果;融合層次化提示的預訓練,更好地建模不同任務的共性與特性;將不同任務組織成統一的自然語言形式,統一建模增強模型的泛化能力,其相較于其他NLP大模型,在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。

近年來,百度AI技術加速落地,新興的AIGC更是引人注目。AIGC是繼 UGC、PGC之后新型利用AI技術自動生成內容的生產方式。百度研究院預測,2022年AIGC技術將借助大模型的跨模態綜合技術能力,可以激發創意,提升內容多樣性,降低制作成本,實現大規模應用。

本次度曉曉寫高考作文,就是基于飛槳文心大模型實現的AIGC創作,文心大模型具備“知識增強”的核心特點,能從大規模知識和海量數據中進行融合學習,學習效率更高、效果更好,具有通用性好、泛化性強的特點。

除了智能寫作,在文心大模型的支持下,AI已經具備很強的理解和生成能力,能夠實現創意作品的自動生成,包括AI作畫、AI寫歌、AI剪輯等,未來,基于大模型的AIGC將會開放賦能到更多的內容生產領域。除了在智能創作上外,文心大模型也已經在工業、能源、教育、金融、通信、媒體等諸多行業得到應用。

預訓練大模型使AI通用性增強

大模型是AI領域最重要的前沿技術方向,自2018年OpenAI推出1.1億參數的GPT以后,谷歌、微軟、Facebook等相繼推出自己的預訓練模型,2020年OpenAI再次推出1750億參數的GPT-3,更是引發科研機構和企業在大模型研究的競賽,大模型的參數規模逐漸增加。

2021年大模型層出不窮,1月,谷歌發布首個萬億級模型Switch Transformer;3月,北京智源研究院發布悟道1.0,6月發布悟道2.0,參數規模超過百億;4月,華為云發布盤古大模型,這是業界首個千億參數中文語言預訓練模型;9月,浪潮發布參數量達2457億的巨量模型“源1.0”;11月,英偉達與微軟聯合發布5300億參數的“MT-NLG”;同在11月,阿里達摩院宣布其多模態大模型M6最新參數從萬億躍遷至10萬億,超過谷歌、微軟此前發布的萬億級模型,成為全球最大的AI預訓練模型。

預訓練大模型其實是機器學習的一種方式,類比人的學習來看,人的學習可以分成通識教育和專業教育兩段,預訓練大模型相當于解決機器學習的通識教育。此前,機器學習主要通過標注數據,告訴算法哪個數據是正負樣本等進行學習。由于人工智能落地場景很多,每個場景都要采數據、標數據,因此在標注的數量和質量上存在很大的瓶頸。

為解決以上問題,自然語言處理領域迎來了一個新的突破:自監督學習,指的是不用人為標注數據,機器可以用一個方法把知識和規律學出來。比如,在模型訓練中,如果我們把“中國的首都是北京”這句話中的“北京”蓋住,讓模型去猜中國的首都是哪里,模型可能會猜一個城市,再把蓋的地方翻開,告訴模型是對了還是錯了,模型也就得到了反饋。

通過設計類似的學習方式,讓模型可以在海量的數據當中進行自監督學習。這個機制的好處就是,它可以把天然存在的大量數據利用起來,打破一定要精標數據才能學習的瓶頸,大模型的出現,實際上是為了大幅度降低了行業應用的門檻。

還有一個特別容易理解的解釋,預訓練大模型是在一個原始任務上預先訓練一個初始模型,然后在目標任務上使用該模型,針對目標任務的特性,對該初始模型進行精調,從而達到提高目標任務的目的。在本質上,這是一種遷移學習的方法,在自己的目標任務上使用別人訓練好的模型。

整體而言,預訓練大模型的興起,使得人工智能的通用性進一步增強,大模型具有效果好、泛化性強、研發流程標準化程度高等特點,正在成為人工智能技術及應用的新基座。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能
    +關注

    關注

    8

    文章

    1751

    瀏覽量

    122122
  • 百度
    +關注

    關注

    9

    文章

    2377

    瀏覽量

    94887
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265436
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是大模型,智能體...?大模型100問,快速全面了解!

    一、概念1.什么是大模型?大模型是指參數規模巨大(通常達到數十億甚至萬億級別)、使用海量數據訓練而成的人工智能
    的頭像 發表于 02-02 16:36 ?903次閱讀
    什么是大<b class='flag-5'>模型</b>,智能體...?大<b class='flag-5'>模型</b>100問,快速全面了解!

    中科創達旗下悟智能與北京人形機器人創新中心達成戰略合作

    2026年1月20日,杭州悟智能有限公司(以下簡稱"悟智能")與北京人形機器人創新中心(下稱"北京人形")在北京正式簽署戰略合作協議,雙方將圍繞人形機器人在汽車制造、倉儲物流和商業服務等垂直場景的規模化應用展開深度合作,共同
    的頭像 發表于 01-21 17:23 ?1776次閱讀

    匯誠儀器與安徽球新材料達成合作,DSC助力材料研發升級

    近日,南京匯誠儀器儀表有限公司與安徽球新材料科技有限公司正式達成合作,向其交付差示掃描量熱儀DSC-600C,為球新材料在鋰電池極耳、軟包裝膜等產品的研發與質控工作提供核心熱分析支持。此次合作
    的頭像 發表于 01-20 17:27 ?1327次閱讀
    匯誠儀器與安徽<b class='flag-5'>曉</b>球新材料達成合作,DSC助力材料研發升級

    請問,不用的型號,讀寫速率是5ms或者4ms,而時鐘都是1MHZ,是因為什么原因決定的?

    請問,不用的型號,讀寫速率是5ms或者4ms,而時鐘都是1MHZ,是因為什么原因決定的?
    發表于 01-16 06:19

    機器人發布開悟3.0,國產世界模型讓機器人擁有“超級大腦”

    機器人的使命就是讓每個機器人都擁有一個聰明的大腦,洞察萬物,學會與視覺精準交互。 ? 在此背景下,大機器人憑借其原創的“世界模型”技術體系,正快速崛起為具身智能領域的關鍵推動者。就在12月,大機器人正式發布“開悟
    的頭像 發表于 12-25 09:25 ?2523次閱讀
    大<b class='flag-5'>曉</b>機器人發布開悟3.0,國產世界<b class='flag-5'>模型</b>讓機器人擁有“超級大腦”

    中科曙光與商湯科技、大機器人達成戰略合作

    12月18日,在首屆光合組織人工智能創新大會(HAIC2025)主論壇上,中科曙光與商湯科技、大機器人正式達成戰略合作。
    的頭像 發表于 12-23 15:10 ?419次閱讀

    商湯科技聯合創始人王剛擔任大機器人董事長

    機器人將于12月18日正式亮相,重磅發布多項全球領先的技術與產品陣列,并將推出首個國內開源且實現商業應用的“開悟”世界模型3.0,與行業伙伴一同構建自主可控、開放共贏的產業體系。商湯科技聯合創始人、執行董事王剛出任大
    的頭像 發表于 12-08 11:31 ?648次閱讀

    RA8P1部署ai模型指南:從訓練模型到部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓練好的模型”穩定地“跑在板子上”,決定了項目能否落地。我們帶你基于RA8P1平臺,跑通從數據準備、模型訓練、量
    的頭像 發表于 11-20 18:06 ?2087次閱讀
    RA8P<b class='flag-5'>1</b>部署ai<b class='flag-5'>模型</b>指南:從<b class='flag-5'>訓練</b><b class='flag-5'>模型</b>到部署?|?本周六

    華為宋迪出席AfricaCom 2025并發表主題演講

    在2025年非洲通信展(AfricaCom 2025)上,華為Small Cell產品線總裁宋迪應邀出席并發表題為“抓住三大機遇,建設數字非洲”的主題演講。宋迪指出,在數字經濟成為全球增長新引擎
    的頭像 發表于 11-12 11:23 ?766次閱讀

    中科創達旗下悟智能與智馳致遠達成戰略合作

    有限公司(KNEWBOTS),(以下簡稱“悟智能”)與中際旭創旗下汽車光電子品牌智馳致遠(ReinOCS)(以下簡稱“智馳致遠“)于N1-B3悟智能展位正式簽署戰略合作協議。雙方旨在依托各自在機器人與光通信行業
    的頭像 發表于 10-31 14:35 ?590次閱讀

    在Ubuntu20.04系統中訓練神經網絡模型的一些經驗

    模型。 我們使用MNIST數據集,訓練一個卷積神經網絡(CNN)模型,用于手寫數字識別。一旦模型訓練并保存,就可以用于對新圖像進行推理和預
    發表于 10-22 07:03

    新一代超大模型訓練引擎XTuner V1開源

    9月8日,上海人工智能實驗室(上海AI實驗室)開源書生大模型新一代訓練引擎XTuner V1
    的頭像 發表于 09-10 10:55 ?1138次閱讀

    如何進行YOLO模型轉換?

    我目前使用的轉模型代碼如下 from ultralytics import YOLOimport cv2import timeimport nncaseimport# 加載訓練的YOLO模型
    發表于 08-14 06:03

    用PaddleNLP為GPT-2模型制作FineWeb二進制訓練數據集

    作者:算力魔方創始人/英特爾創新大使劉力 《用PaddleNLP在4060單卡上實踐大模型訓練技術》發布后收到讀者熱烈反響,很多讀者要求進一步講解更多的技術細節。本文主要針對大語言模型
    的頭像 發表于 03-21 18:24 ?4321次閱讀
    用PaddleNLP為GPT-2<b class='flag-5'>模型</b>制作FineWeb二進制<b class='flag-5'>預</b><b class='flag-5'>訓練</b>數據集

    商湯絕影王剛亮相NVIDIA GTC 2025并發表主題演講

    商湯科技聯合創始人、首席科學家、商湯絕影CEO王剛在NVIDIA GTC 2025發表演講《激發通用人工智能的創造力,引領智能汽車走向全新的未來》。
    的頭像 發表于 03-21 14:37 ?1184次閱讀