国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

<cite id="5v8te"><small id="5v8te"></small></cite>

<dd id="5v8te"><label id="5v8te"></label></dd>

<mark id="5v8te"></mark>

<blockquote id="5v8te"></blockquote>

<pre id="5v8te"></pre>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會議

卡奧斯智能交互引擎是卡奧斯基于海爾近40年工業生產經驗積累和卡奧斯7年工業互聯網平臺建設的最佳實踐，基于大語言模型和RAG技術，集合海量工業領域生態資源方優質產品和知識服務，旨在通過智能搜索、連續交互，實時生成個性化的內容和智能化產品推薦，為用戶提供快速、可靠的交互式搜索服務，首創了聚焦工業領域的智能交互引擎。

詳情戳：卡奧斯智能交互引擎

大模型圈再曝抄襲大瓜，這回，“被告”還是大名鼎鼎的谷歌DeepMind。

“原告”直接怒噴：他們就是把我們的技術報告洗了一遍！

具體是這么個事兒：

谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了，瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。

兩篇論文探討的都是一種規范模型文本生成結構的方法。

抓馬的是，谷歌DeepMind這篇論文中確實明晃晃寫著引用了“原告”的論文。

然鵝，即便是標明了引用，“原告”的兩位論文作者Brandon T. Willard（布蘭登）和R′emi Louf（雷米）還是堅稱谷歌抄襲，并認為：

谷歌對兩者差異性的表述“簡直荒謬”。

而不少網友看過論文后也緩緩打出一個問號：CoLM是怎么審的稿？

唯一區別是換了概念？

趕緊瞅一眼論文對比……

兩篇論文的比較

先淺看一眼兩篇論文的摘要對比。

谷歌DeepMind的論文說的是，tokenization給約束語言模型輸出帶來了麻煩，他們引入自動機理論來解決這些問題，核心是避免在每個解碼步驟遍歷所有邏輯值（logits）。

該方法只需要訪問每個token的解碼邏輯值，計算與語言模型的大小無關，高效且易用于幾乎所有語言模型架構。

而“原告”的說法大致是：

提出了一個高效框架，通過在語言模型的詞匯表上構建索引，來大幅提升約束文本生成的效率。簡單來說，就是通過索引避免對全部邏輯值的遍歷。

同樣“不依賴于具體模型”。

方向上確實大差不差，我們還是接著來看看更多詳細內容。

我們用谷歌Gemini 1.5 Pro分別總結了兩篇論文的主要內容，并接著讓Gemini來比較兩者的異同。

對于“被告”谷歌這篇論文，Gemini總結其方法是將detokenization重新定義為有限狀態轉換器（FST）操作。

將此FST與表示目標形式語言的自動機組合，這種自動機可以用正則表達式或語法來表示。

通過以上結合，生成一個基于token的自動機，用于在解碼過程中約束語言模型，確保其輸出的文本符合預設的形式語言規范。

此外，谷歌論文中還進行了一系列正則表達式擴展，這些擴展通過使用特別命名的捕獲組來編寫，顯著提升了系統處理文本時的效率和表達能力。

而對于“原告”論文，Gemini總結其方法的核心是將文本生成問題重新定義為有限狀態機（FSM）之間的轉換。

“原告”的具體方法是：

利用正則表達式或上下文無關文法構建FSM，并將其用于指導文本生成過程。

通過構建詞匯表索引，高效地確定每個步驟中的有效詞，避免遍歷整個詞匯表。

Gemini列出了兩篇論文的共同點。

至于兩者的區別，有點像前頭那位網友說的，簡單總結就是：谷歌將詞匯表定義為了一個FST。

前面也說到了，谷歌在“Related work”中將原告論文列為“最相關”的一項工作：

最相關的研究是Outlines（Willard&Louf, 2023），該研究同樣采用有限狀態自動機（FSA）和下推自動機（PDA）作為約束手段——我們的方法是在2023年初獨立開發的。

谷歌認為兩者的差異在于，Outlines的方法基于一種特制的“索引”操作，需要手動擴展到新的應用場景。相比之下，谷歌使用自動機理論徹底重新定義了整個過程，使得應用FSA和泛化到PDA變得更加容易。

另一個區別是，谷歌定義了擴展以支持通配符匹配，并提高了可用性。

谷歌緊接著在介紹下面的兩項相關工作中，也都提到了Outlines。

一項是Yin等人（2024年）通過增加“壓縮”文本段到預填充的功能，擴展了Outlines。

另一項是Ugare等人（2024年）近期提出的一個系統，名為SynCode。它也利用FSA，但采用LALR和LR解析器而非PDA處理語法。

與Outlines類似，該方法依賴于定制算法。

但吃瓜群眾們顯然不是很買賬：

CoLM的評審們應該注意。我不認為這看上去是各自獨立的“同期工作”。

網友：這事兒不罕見…

這件事一發酵，不少網友都怒了，抄襲可恥，更何況“科技巨頭剽竊小團隊的工作成果不是第一次了”。

順便一提，布蘭登和雷米發布原告論文的時候都在給Normal Computing遠程工作，這家AI Infra公司成立于2022年。

哦對了，Normal Computing的創始團隊有一部分就來自Google Brain……

另外，布蘭登和雷米現在合伙出來創業了，新公司名叫.txt，官網信息顯示，其目標是提供快速可靠的信息提取模型。并且官網掛出的GitHub主頁，就是Outlines倉庫。

說回到網友這邊，更讓大家伙兒生氣的是，“這種情況已經變得普遍”。

一位來自荷蘭代爾夫特理工大學的博士后分享了自己的遭遇：

去年10月我們完成了一項工作，最近有篇已被接收的論文采用了相同的思路和概念，但甚至沒有引用我們的論文。

還有一位美國東北大學的老哥更慘，這種情況他遭遇過兩次，下手的還都是同一個組。并且對面那位第一作者還給他的GitHub加過星標……

不過，也有網友表達了不同的意見：

如果說發個博客文章或未經評估的預印本論文就算占坑了，那人人都會占坑，不是嗎？

對此，雷米怒懟：

好家伙，發布預印本論文并開源代碼 = 占坑；
寫篇數學論文，甚至不需要任何偽代碼 = 好工作？？？

布蘭登老哥也表示yue了：

開源代碼并撰寫相關論文是“占坑”，復制別人的工作卻說“我更早有了這個想法”且投稿了會議反而不是啦？真惡心。

瓜就先吃到這里，對此你有什么想法？不妨在評論區繼續討論~

兩篇論文戳這里：
谷歌DeepMind論文：https://arxiv.org/abs/2407.08103v1
原告論文：https://arxiv.org/abs/2307.09702

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6254

瀏覽量
111372
DeepMind

DeepMind

+關注

關注
0

文章
131

瀏覽量
12285
ChatGPT

ChatGPT

+關注

關注
31

文章
1598

瀏覽量
10264

評論

精選推薦
更多

文章

資料

帖子

匠芯創D213ECV實現PicoClaw極簡部署（附體驗過程）

jf_69054165
20小時前

897 閱讀

從點云到圖像級！華為新一代896線激光雷達來襲，分辨率提升4倍

章鷹觀察
15小時前

1703 閱讀

睿擎派3562快速上手體驗

RT-Thread官方賬號
1天前

958 閱讀

MWC2026:6G狂飆！華為、高通、英偉達等五大巨頭，亮出哪些突破性技術

章鷹觀察
22小時前

2610 閱讀

中科芯CKS32F107XX系列MCU的以太網介紹（二）

中科芯MCU
21小時前

1344 閱讀

移動U盤電路原理圖

名士流
43

10積分

3129下載

PADS PowerPCB快速入門教程

ophelia451
1.65 MB

免費

0下載

以太網控制器驅動免費下載

yezi888
19.6 MB

免費

245下載

《智能照明設計攻略大合集》-EE Design系列白皮書

yelang2116
5037KB

8積分

0下載

JWordpress Java博客系統

李娟
4.00 MB

2積分

1下載

【飛凌嵌入式RV1126B開發板】+基本功能測試篇（1）

jennyzhaojie
1天前

137 閱讀

【飛凌嵌入式RV1126B開發板】+初識篇

jennyzhaojie
2天前

177 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發板的詳細對比

行走的小派
2天前

511 閱讀

OrangePi RV2 深度技術評測：RISC-V AI融合架構的先行者

行走的小派
3天前

856 閱讀

lab view NI6003搭建電路

jf_73763743
3天前

858 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视