国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用算法開發了一種新的自然語言生成解碼方式

深度學習自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:Yimin_飯煲 ? 2022-08-02 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

相信大多數學習過人工智能課程的讀者,當聽到算法的時候,都會有一種既熟悉又陌生的感覺。說算法熟悉,是因為一聽到這個算法,就想起那本厚厚的《人工智能——一種現代的方法》,想起這個算法似乎是人工智能課程考試的重點;說算法陌生,是因為大家現在在從事人工智能相關的研究和開發工作時,似乎又很少用到這個算法,大部分時間都花在了研究數據處理和處理實驗設置上面。而在NAACL2022上,一群來自AI2的自然語言處理研究者們利用算法開發了一種新的自然語言生成解碼方式,還被授予了NAACL2022 Best New Method paper。看起來已經過時的A*算法,居然能在深度學習時代有如此的妙用,看完這篇論文,筆者情不自禁地打開了《人工智能——一種現代的方法》,想看看還有什么經典算法可以深挖一下!

論文標題:
NEUROLOGIC A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

論文鏈接:
https://arxiv.org/pdf/2112.08726.pdf

問題背景

自然語言生成任務一般指給定一個輸入序列,生成一個輸出序列。目的是解出使得目標函數最大化的序列,其中, , 而衡量對約束條件的滿足。傳統的Beam Search不考慮全局的最優,而是最優化當前步驟添加的Token.

為了達到全局最優的效果,需要滿足如下的優化目標

主要方法

前向啟發算法

直接優化全局最優目標面臨著搜索空間過大的問題。而A算法可以被用來解決這個搜索問題。A算法是一個最優優先的搜索算法,可以解決這樣形式的搜索問題:

其中是迄今為止的分數,是對于未來分數的啟發式估計。因此我們將優化目標修改為如下形式

同時,需要限制前向搜索的長度為,避免模型無限制地向前搜索

在前向生成的過程中有幾種不同的方法。方法只生成一個序列,從開始,每次選擇概率最大的Token。方法采用插值的思想,混合方法和隨機選擇一個Token的概率分布。方法從開始進行步的Beam Search,選擇前個概率最大的序列, 而方法則是直接從按照概率進行采樣。

無限制生成

在無限制生成的場景下,使用的優化函數為

其中控制的是對未來估計的重視程度,類似于加權算法

受限制生成

在受限制生成任務上,作者們基于之前的工作NeuroLogic進行改進。首先我們簡要介紹一下NeuroLogic方法。首先,將對生成文本的限制表示為合取范式。其中每一個表示一個限制條件,。NeuroLogic的優化目標可以寫為

其中遠大于0,用來懲罰不滿足的約束。在每一步搜索時,NeuroLogic利用如下的打分函數進行計算

其中是約束條件的前綴,這個優化函數的目標是獎勵那些滿足約束條件的樣本。接下來,作者們加入了前向啟發函數

這樣的前向啟發函數有兩個好處,如果是滿足多Token約束的一個Token,前向啟發函數包含了全部約束的分數,如果不是約束的一部分,如果被選中,這一前向策略能考慮到未來約束的分數。

實驗結果

無限制生成

0b4c6ef6-118e-11ed-ba43-dac502259ad0.png

作者們在故事生成任務上開展了實驗,可以發現提出的方法不論是在流暢性,豐富性還是人工評估上都有著很好的表現。

受限制生成

在受限制生成方面,作者們在常識生成,機器翻譯,表格到文本生成,問題生成等任務上開展了實驗。在這里展示常識生成方面的結果。這一任務的主要內容是給定一系列概念,利用全部概念生成一個合理的句子.

0b65b0be-118e-11ed-ba43-dac502259ad0.png

可以發現,作者們提出的方法在多個指標上都明顯超越了基線模型,取得了很好的效果。

0b779a5e-118e-11ed-ba43-dac502259ad0.png

從文章中給出的例子來看,作者們提出的方法確實有著更好的生成效果。

結語

本文的方法實現并不復雜,所用到的原理和思想也是非常經典的人工智能算法,但卻取得了非常不錯的性能,一舉摘得了NAACL2022的最佳方法論文。看來,好的研究并不是追逐熱點,調參魔改結構的增量式創新,而是打好數學基礎,深入地思考研究問題,廣泛接觸各個領域的算法,才能在發現領域的關鍵待解決問題時取得成果~

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98072
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265415
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124400

原文標題:NAACL最佳方法論文 | 課本上的A*搜索算法可以提升文本生成效果!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的個分支,它會教計算機如何理解口頭和書面形式的人類語言自然語言處理將計算語言學與機器學習
    的頭像 發表于 01-29 14:01 ?374次閱讀
    <b class='flag-5'>自然語言</b>處理NLP的概念和工作原理

    8常用的CRC算法分享

    CRC 計算單元可按所選擇的算法和參數配置來生成數據流的 CRC 碼。有些應用中,可利用 CRC 技術來驗證數據的傳輸和存儲的完整性。 8 常用的 CRC
    發表于 11-13 07:25

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領域國際權威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結果,云知聲提交的《面向門診病歷生成的高質量醫患對話合
    的頭像 發表于 11-10 17:30 ?806次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b>處理頂會EMNLP 2025

    不只有AI協作編程(Vibe Coding):生成式系統級芯片(GenSoC)將如何把生成式設計推向硬件層面

    但是否能將這種生成式的、目標驅動的方法從軟件層向下延伸呢?這理念是否可以直接應用于硬件本身呢?通過GenSoC,開發者可用自然語言或高級模型描述系統行為,XMOS的工具鏈將自動
    的頭像 發表于 11-07 14:04 ?537次閱讀

    復雜的軟件算法硬件IP核的實現

    源代碼編譯為 HDL 的過程共分為兩步: (1)C to HASM (2)HASM to HDL 第步 C to HASM 是將 C 語言描述的算法編譯為
    發表于 10-30 07:02

    HarmonyOSAI編程自然語言代碼生成

    安裝CodeGenie后,在下方對話框內,輸入代碼需求描述,將根據描述智能生成代碼,生成內容可鍵復制或鍵插入至編輯區當前光標位置。 提問示例 使用ArkTs
    發表于 09-05 16:58

    HarmonyOSAI編程頁面生成

    支持通過自然語言對話,生成應用/元服務可用的頁面代碼,生成結果支持實時預覽,幫助開發者快速完成頁面搭建。 點擊頁面右側菜單欄CodeGenie圖標,完成登錄后在輸入框輸入\"/\&qu
    發表于 08-29 15:50

    【HZ-T536開發板免費體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發板上搭建 MCP 服務器,自然語言輕松控板

    ifconfig、gpio write 1 1)。 工作流程 : MCP客戶端發送自然語言指令到 HZ-T536 的 MCP 服務器; MCP 服務器利用DeepSeek的大語言模型能力,生成
    發表于 08-23 13:10

    HarmonyOSAI編程編輯區代碼生成

    CodeGenie提供Inline Edit能力,支持在編輯窗口中通過自然語言進行問答,基于上下文智能生成代碼片段,提升代碼可讀性。 當前有以下兩方式喚醒Inline Edit對話框
    發表于 08-20 15:24

    HarmonyOS AI輔助編程工具(CodeGenie)頁面生成

    支持通過自然語言對話,生成應用/元服務可用的頁面代碼,生成結果支持實時預覽,幫助開發者快速完成頁面搭建。該功能從DevEco Studio 6.0.0 Beta1版本開始支持。 點擊頁
    發表于 08-13 10:38

    RDK × 腿臂機器人:這只 “機械汪” 竟會說人話、走花路!

    ,基于RDKX3平臺進行AI大模型算法開發,提出了一種融合AI大模型的創新性解決方案,提升腿臂機器人的綜合性能。-項目首先強化了機器人的多模態感知能力,利用雷達、攝像
    的頭像 發表于 07-01 20:27 ?1264次閱讀
    RDK × 腿臂機器人:這只 “機械汪” 竟會說人話、走花路!

    小白學大模型:從零實現 LLM語言模型

    在當今人工智能領域,大型語言模型(LLM)的開發已經成為個熱門話題。這些模型通過學習大量的文本數據,能夠生成自然語言文本,完成各種復雜的任
    的頭像 發表于 04-30 18:34 ?1312次閱讀
    小白學大模型:從零實現 LLM<b class='flag-5'>語言</b>模型

    自然語言提示原型在英特爾Vision大會上首次亮相

    在英特爾Vision大會上,Network Optix首次展示了自然語言提示原型,該方案將重新定義視頻管理,為各行各業由AI驅動的洞察和效率提速。
    的頭像 發表于 04-09 09:30 ?965次閱讀

    零知開源——ESP32語音交互系統(AI小智)開發教程

    小智AI聊天機器人是個基于嵌入式硬件與人工智能技術深度融合的智能交互系統。該項目以ESP32開發板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現人
    的頭像 發表于 03-29 15:33 ?1.2w次閱讀
    零知開源——ESP32語音交互系統(AI小智)<b class='flag-5'>開發</b>教程

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結合視覺(圖像/視頻)和語言(文本)處理能力的多模態人工智能模型,能夠理解并生成與視覺內容相關的
    的頭像 發表于 03-17 15:32 ?8853次閱讀
    ?VLM(視覺<b class='flag-5'>語言</b>模型)?詳細解析