国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于GTP-4,這是14個被忽略的驚人細節!

穎脈Imgtec ? 2023-04-04 16:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:華爾街見聞(id:wallstreetcn)


3月14日,OpenAI發布了GPT-4。向科技界再次扔下了一枚“核彈”。根據OpenAI的演示,我們知道了GPT-4擁有著比GPT-3.5更強大的力量:總結文章、寫代碼、報稅、寫詩等等。但如果我們深入OpenAI所發布的技術報告,我們或許還能發現有關GPT-4更多的特點……

以及一些OpenAI沒有點名和宣揚的,可能會令人背后一涼的細節。


1. 新Bing裝載GPT-4

自然而然地,GPT-4發布之時,新Bing也已經裝載了最新的版本。

根據微軟Bing副總裁Jordi Ribas在推特上所述,裝載了GPT-4的新Bing已經將問答限制提升到了一次15個問題,一天最多提問150次。


2. 文本長度擴大八倍

在GPT-4上,文本長度被顯著提高。

在此之前我們知道,調用GPT的API收費方式是按照“token”計費,一個token通常對應大約 4 個字符,而1個漢字大致是2~2.5個token。

在GPT-4之前,token的限制大約在4096左右,大約相當于3072個英文單詞,一旦對話的長度超過這個限制,模型就會生成不連貫且無意義的內容。

然而,到了GPT-4,最大token數為32768個,大約相當于24576個單詞,文本長度被擴大了八倍。

也就是說,GPT-4現在可以回答更長的文本了。OpenAI在文檔中表示,現在GPT-4限制的上下文長度限制為8192個token,允許32768個token的版本名為GPT-4-32K,目前暫時限制了訪問權限。在不久的未來,這一功能可能會被開放。


3.模型參數成為秘密

我們知道,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億,但這一情況在GPT-4被改變了。

OpenAI在報告中表示:

考慮到競爭格局和大型模型(如GPT-4)的安全影響,本報告沒有包含有關架構(包括模型大小)、硬件、訓練計算、數據集構造、訓練方法或類似內容的進一步細節。

這意味著OpenAI沒有再披露GPT-4模型的大小、參數的數量以及使用的硬件。

OpenAI稱此舉是考慮到對競爭者的憂慮,這可能是在暗示其對于競爭者——谷歌Bard——所采取的策略。

此外,OpenAI還提到“大型模型的安全影響”,盡管沒有進一步解釋,但這同樣也暗指生成式人工智能所可能面對的更嚴肅的問題。


4.有選擇地表達的“優秀”GPT-4推出后,我們都看到了這一模型較上一代的優秀之處:

GPT-4通過模擬律師考試,分數在應試者的前10% 左右;相比之下,GPT-3.5 的得分在倒數 10% 左右。

但這實際上是OpenAI的一個小把戲——它只展示給你GPT-4最優秀的那部分,而更多的秘密藏在報告中。

下圖顯示的是GPT-4和GPT-3.5參加一些考試的成績表現??梢钥吹?,GPT-4并非在所有考試中的表現都那么優秀,GPT-3.5也并非一直都很差勁。

384ac628-cd4f-11ed-ad0d-dac502259ad0.png


5. “預測”準確度提升在ChatGPT推出以來,我們都知道這一模型在很多時候會“一本正經地胡說八道”,給出很多看似有理但實際上并不存在的論據。尤其是在預測某些事情的時候,由于模型掌握了過去的數據,這反而導致了一種名為“后見之明”的認知偏差,使得模型對于自己的預測相當自信。OpenAI在報告中表示,隨著模型規模的增加,模型的準確度本應逐漸下降,但GPT-4逆轉了這一趨勢,下圖顯示預測精確度提升到了100。

385c4f06-cd4f-11ed-ad0d-dac502259ad0.png

OpenAI表示,雖然GPT-4的準確度顯著提高,但預測仍是一件困難的事,他們還將就這一方面繼續訓練模型。


6. 還有30%的人更認可GPT3.5

盡管GPT-4展現出了比GPT-3.5優秀得多的能力,但OpenAI的調查顯示,有70%的人認可GPT-4輸出的結果:

GPT-4在遵循用戶意圖的能力方面比以前的模型有了大幅提高。在提交給ChatGPT和OpenAI API的5214個提示的數據集中,70.2%GPT-4生成的回答優于GPT3.5。

3878dc34-cd4f-11ed-ad0d-dac502259ad0.png

這意味著:仍有30%的人更認可GPT-3.5。


7. GPT-4語言能力更佳

盡管許多機器學習的測試都是用英文編寫的,但OpenAI仍然用許多其他的語言對GPT-4進行了測試。

測試結果顯示,在測試26種語言中的24種中,GPT-4優于 GPT-3.5和其他 LLM(Chinchilla、PaLM)的英語語言性能,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言:

38a05afc-cd4f-11ed-ad0d-dac502259ad0.png


8. 新增圖像分析能力

圖像分析能力是此次GPT-4最顯著的進步之一。

OpenAI表示,GPT-4可以接受文本和圖像的提問,這與純文本設置并行,且允許用戶制定任何視覺或語言的任務。具體來說,它可以生成文本輸出,用戶可以輸入穿插的文本和圖像。在一系列領域——包括帶有文本和照片的文檔、圖表或屏幕截圖——GPT-4 展示了與純文本輸入類似的功能。GPT-4可以準確地描述出圖片中的滑稽之處(大型 VGA 連接器插入小型現代智能手機充電端口,一個人站在出租車后方熨衣服)。

OpenAI還對GPT-4的圖像分析能力進行了學術標準上的測試:

39269efa-cd4f-11ed-ad0d-dac502259ad0.png

不過,GPT-4的圖像分析功能尚未對外公開,用戶可以通過bemyeye網站加入等候隊列。


9. 仍然存在錯誤

盡管GPT-4功能強大,但它與早期GPT模型有相似的局限性。

OpenAI表示,GPT-4仍然不完全可靠——它會“產生幻覺”事實并犯推理錯誤

在使用語言模型輸出時,特別是在高風險上下文中,應該非常小心,使用與特定應用程序的需求相匹配的確切協議(例如人工檢查、附加上下文或完全避免高風險使用)。與之前的GPT-3.5模型相比,GPT-4顯著減少了“幻覺”(GPT-3.5模型本身也在不斷迭代中得到改進)。在我們內部的、對抗性設計的事實性評估中,GPT-4的得分比我們最新的GPT-3.5高出19個百分點。

393e776e-cd4f-11ed-ad0d-dac502259ad0.png


10. 數據庫的時間更早

介紹完GPT-4的優點,接下來就是一些(可能有些奇怪的)不足之處。

我們都知道,ChatGPT的數據庫的最后更新時間是在2021年的12月31日,這意味著2022年以后發生的事情不會被知曉,而這一缺陷在之后的GPT-3.5也得到了修復。

但奇怪的是,GPT-4的報告中,OpenAI清晰地寫道:

GPT-4通常缺乏對其絕大多數訓練前數據在2021年9月中斷后發生的事件的知識,并且不從其經驗中學習。它有時會犯一些簡單的推理錯誤,這些錯誤似乎與許多領域的能力不相符,或者過于容易受騙,接受用戶的明顯錯誤陳述。它可以像人類一樣在棘手的問題上失敗,比如在它生成的代碼中引入安全漏洞。

3957d0ba-cd4f-11ed-ad0d-dac502259ad0.png

2021年9月……甚至比GPT-3還早。

在裝載了GPT-4的最新ChatGPT中,當我們問起“誰是2022年世界杯冠軍”時,ChatGPT果然還是一無所知:

39721efc-cd4f-11ed-ad0d-dac502259ad0.png

但當借助了新Bing的檢索功能后,它又變得“聰明”了起來:

39816d58-cd4f-11ed-ad0d-dac502259ad0.png


11. 可能給出犯罪建議

在報告中,OpenAI提到了GPT-4可能仍然會幫助犯罪——這是在此前的版本都存在的問題,盡管OpenAI已經在努力調整,但仍然存在

與之前的GPT模型一樣,我們使用強化學習和人類反饋(RLHF)對模型的行為進行微調,以產生更好地符合用戶意圖的響應。然而,在RLHF之后,我們的模型在不安全輸入上仍然很脆弱,有時在安全輸入和不安全輸入上都表現出我們不希望看到的行為。在RLHF路徑的獎勵模型數據收集部分,當對標簽器的指令未指定時,就會出現這些不希望出現的行為。當給出不安全的輸入時,模型可能會生成不受歡迎的內容,例如給出犯罪建議。此外,模型也可能對安全輸入過于謹慎,拒絕無害的請求或過度對沖。為了在更細粒度的級別上引導我們的模型走向適當的行為,我們在很大程度上依賴于我們的模型本身作為工具。我們的安全方法包括兩個主要組成部分,一套額外的安全相關RLHF訓練提示,以及基于規則的獎勵模型(RBRMs)。

399a8522-cd4f-11ed-ad0d-dac502259ad0.png


12.垃圾信息

同樣地,由于GPT-4擁有“看似合理地表達錯誤事情”的能力,它有可能在傳播有害信息上頗為“有用”:

GPT-4可以生成逼真而有針對性的內容,包括新聞文章、推文、對話和電子郵件。在《有害內容》中,我們討論了類似的能力如何被濫用來剝削個人。在這里,我們討論了關于虛假信息和影響操作的普遍關注基于我們的總體能力評估,我們期望GPT-4在生成現實的、有針對性的內容方面優于GPT-3。但,仍存在GPT-4被用于生成旨在誤導的內容的風險

39ae3536-cd4f-11ed-ad0d-dac502259ad0.png


13. 尋求權力

從這一條開始,接下來的內容可能有些恐怖。

在報告中,OpenAI提到了GPT-4出現了“尋求權力”的傾向,并警告這一特征的風險:

在更強大的模型中經常出現新的能力。一些特別令人關注的能力是創建長期計劃并采取行動的能力,積累權力和資源(“尋求權力”),以及表現出越來越“代理”的行為。這里的 “代理”不是指語言模型的人性化,也不是指智商,而是指以能力為特征的系統,例如,完成可能沒有具體規定的、在訓練中沒有出現的目標;專注于實現具體的、可量化的目標;以及進行長期規劃。已經有一些證據表明模型中存在這種突發行為。對于大多數可能的目標,最好的計劃涉及輔助性的權力尋求,因為這對推進目標和避免目標的改變或威脅有內在的幫助。更具體地說,對于大多數獎勵函數和許多類型的代理人來說,權力尋求是最優的;而且有證據表明,現有模型可以將權力尋求確定為一種工具性的有用策略。因此,我們對評估權力尋求行為特別感興趣,因為它可能帶來高風險。

更為令人毛骨悚然的是,在Openai提到的另一篇論文中寫道:

相反,我們使用代理這個術語來強調一個日益明顯的事實:即機器學習系統不完全處于人類控制之下。

39e18972-cd4f-11ed-ad0d-dac502259ad0.png


14. 賦予GPT-4錢、代碼和夢想

最后一個小細節。

在測試GPT-4的過程中,OpenAI引入的外部的專家團隊ARC作為“紅方”。在報告的一條注釋中,OpenAI提到了ARC的一個操作:

為了模擬GPT-4像一個可以在現實世界中行動的代理一樣的行為,ARC將GPT-4與一個簡單的讀取-執行-打印循環結合起來,允許模型執行代碼,進行鏈式推理,并委托給自己的副本。ARC隨后推進了在云計算服務上運行這個程序的一個版本,用少量的錢和一個帶有語言模型API的賬戶,是否能夠賺更多的錢,建立自己的副本,并增加自己的穩健性。

39f8ed60-cd4f-11ed-ad0d-dac502259ad0.png

也就是說,ARC賦予了GPT-4自我編碼、復制和執行的能力,甚至啟動資金——GPT-4已經可以開始自己賺錢了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301497
  • 人工智能
    +關注

    關注

    1817

    文章

    50102

    瀏覽量

    265518
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PCB拼板三大細節要點

    架等治具務必等廠商提供生產資料后再進行制作,PCB廠商的生產資料是制作治具的唯一準確依據。 拼板生產的本質是設計需求與生產信息的精準傳遞。 細節定成敗,量產更高效。任何一微小的信息偏差都可能引發連鎖問題,標準一致、信息透明,才是拼板無誤生產的核心保障。 點擊領券免費下單
    發表于 01-23 14:00

    PCB拼版三大細節要點

    從PCB設計到量產,任何環節都需細心對待,千萬別小心翼翼畫板,隨隨便便拼板。本文聚焦三大核心拼板問題,帶您精準避坑,讓量產過程更順暢。要點一:拼版款數需準確雖然多拼板是PCB生產時的常見操作,但不
    的頭像 發表于 01-14 07:36 ?1746次閱讀
    PCB拼版三大<b class='flag-5'>細節</b>要點

    網絡跳線:細節決定成敗的網絡構建者

    在構建一高效、穩定的網絡環境時,我們往往會關注到大型的網絡設備、復雜的網絡架構或是先進的網絡技術,而往往忽略了那些看似微不足道卻至關重要的細節——網絡跳線。然而,正是這些小小的跳線,在網絡的構建
    的頭像 發表于 01-09 10:10 ?279次閱讀

    LoRa 實測距離“縮水”?90% 的人忽略了這 8 細節

    視頻推薦在使用LoRa技術時,你是否遇到過實測通信距離遠低于預期的情況?今天,我們就來深入探討一下無線產品測試中需要注意的關鍵事項,并以ZSL42x智能LoRa組網芯片為例,分析其傳輸距離問題。ZSL42x智能組網芯片ZSL42x智能組網芯片是一款高度集成化、外形小巧且使用便捷的無線通信芯片。其尺寸僅為11mm×11mm×1mm,卻集成了低功耗的32位Cor
    的頭像 發表于 01-07 11:41 ?284次閱讀
    LoRa 實測距離“縮水”?90% 的人<b class='flag-5'>忽略</b>了這 8 <b class='flag-5'>個</b><b class='flag-5'>細節</b>

    探索BGSA14M2N10:超小型天線調諧SP4T開關的卓越性能

    探索BGSA14M2N10:超小型天線調諧SP4T開關的卓越性能 在當今的射頻應用領域,對于高性能、小尺寸的天線調諧開關的需求日益增長。今天,我們就來深入了解一款由英飛凌(Infineon)推出
    的頭像 發表于 12-21 11:25 ?883次閱讀

    使用TTP233H-BA6時這6細節要注意!

    TTP233H-BA6TTP233H-BA6使用時這6細節要注意在電子設計中,選擇一款合適的觸摸檢測芯片至關重要。TTP233H-BA6作為一款單鍵觸摸板檢測器IC,以其低功耗、寬工作電壓和穩定
    的頭像 發表于 12-10 17:41 ?646次閱讀
    使用TTP233H-BA6時這6<b class='flag-5'>個</b><b class='flag-5'>細節</b>要注意!

    行業真相:90%的UPS故障,竟源于選擇公司時忽略這1細節

    UPS
    上海優比施電子科技有限公司
    發布于 :2025年12月10日 08:59:04

    結構化布線中使用電纜標簽的4主要優勢

    帶來諸多顯著的優勢。本文將深入探討在結構化布線中使用電纜標簽的4主要優勢,幫助讀者更好地理解這一細節的重要性。 提高布線系統的可管理性 清晰標識電纜用途 在復雜的布線系統中,各種電纜交織在一起,如果沒有明確的
    的頭像 發表于 11-24 10:34 ?331次閱讀

    AFE7685 4 發射、4 接收 RF 采樣收發器技術手冊

    AFE76xx 是一系列高性能、四通道/雙通道、14 位、集成射頻采樣模擬前端 (AFE),具有 9 GSPS DAC 和 3 GSPS ADC,能夠合成和數字化寬帶信號。高動態范圍使
    的頭像 發表于 11-05 15:30 ?579次閱讀
    AFE7685 <b class='flag-5'>4</b> <b class='flag-5'>個</b>發射、<b class='flag-5'>4</b> <b class='flag-5'>個</b>接收 RF 采樣收發器技術手冊

    關于“實時基準對比測量”與AI再探討

    qqxjyxjy清風:關于“實時基準對比測量”我還想多問一句。 AI: 已深度思考(用時 14 秒) AI: 好的,用戶之前詳細討論了用實時基準對比測量來解決ADA8330增益不確定的問題,現在
    的頭像 發表于 10-14 17:39 ?537次閱讀

    示波器如何利用好?資深工程師也會忽略這些細節……

    這篇文來給大家介紹一下如何利用好示波器。什么是示波器的觸發模式示波器的“觸發”就是使得示波器的掃描與觀測信號同步,從而顯示穩定的波形。為滿足不同的觀測需要,需要不同的“觸發模式”。示波器的基本觸發
    的頭像 發表于 08-20 18:15 ?750次閱讀
    示波器如何利用好?資深工程師也會<b class='flag-5'>忽略</b>這些<b class='flag-5'>細節</b>……

    國產化FPGA-2050-基于JFMK50T4(XC7A50T)的核心板(IEB-PS-3051-郵票孔)

    板卡基于JFMK50T4國產化FPGA芯片,設計的一款工業級核心板,板卡集成主芯片、電源、DDR、配置芯片,大大減輕客戶的擴展開發困難。豐富的IO和4GTP,讓用戶輕易設計PCIe的
    的頭像 發表于 08-15 10:16 ?816次閱讀
    國產化FPGA-2050-基于JFMK50T<b class='flag-5'>4</b>(XC7A50T)的核心板(IEB-PS-3051-郵票孔)

    提供4觸摸輸入端口及4直接輸出端口的4鍵觸摸檢測IC-CT8224C

    CT8224C是一款使用電容式感應原理設計的觸摸IC,此款IC內建穩壓電路給觸摸感測器使用,穩定的感應方式可以應用到各種不同電子類產品。面板介質可以是完全絕源的材料,專為取代傳統的機械結構開關或普通按鍵而設計,提供4觸摸輸入端口及4
    的頭像 發表于 06-05 09:38 ?786次閱讀
    提供<b class='flag-5'>4</b><b class='flag-5'>個</b>觸摸輸入端口及<b class='flag-5'>4</b><b class='flag-5'>個</b>直接輸出端口的<b class='flag-5'>4</b>鍵觸摸檢測IC-CT8224C

    FZH1625 14×4 LCD驅動器中文手冊

    FZH1625 是深圳市方中禾科技有限公司(Premier Chip Limited)推出的一款 14×4 LCD 驅動器,專為低功耗、多功能的顯示應用設計。以下是其核心特性與使用要點:關鍵特性
    發表于 05-23 10:22 ?0次下載

    從設計到打樣:PCBA 前期準備的核心細節解析

    正常焊接,項目進度被迫延遲兩周。那么 PCBA 貼片打樣前,究竟要注意哪些細節? 首先,設計文件的準確性至關重要。Gerber 文件作為生產的核心依據,需確保層疊順序、孔徑參數、線路間距等信息完整無誤。部分設計人員容易忽略阻焊層與絲
    的頭像 發表于 04-30 17:57 ?723次閱讀