国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新火種AI|谷歌深夜發布復仇神器Gemini,原生多模態碾壓GPT-4?

新火種 ? 來源:新火種 ? 作者:新火種 ? 2023-12-08 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:一號

GPT-4最強的對手出現了。

北京時間12月7日凌晨,谷歌CEO“劈柴”突然發布重磅AI殺手锏——Gemini。就在前幾天,還有消息說Gemini要推遲一個月才上線,結果現在這么突然地發布,著實讓AI圈料不到。以谷歌以往的實力,不用想,這又是AI界的一個“不眠之夜”。

在去年ChatGPT發布不到兩周,谷歌就拉響了「警報」來應戰,好不容易搞出來的Bard,在首次亮相的時候卻出現了失誤,讓谷歌市值一夜蒸發了1000億美元。

而且,GPT(Generative Pre-training Transformer)還是基于Transformer開發的,而這個Transformer模型最早還是谷歌提出來,要想谷歌心甘情愿地服輸,可不是那么容易。

果然,這一年的時間里,關于Gemini的消息就層出不窮,有的說谷歌大腦和DeepMind部門合并,幾乎耗盡谷歌內部算力資源,就是為了背水一戰,和OpenAI決戰。

不過前段時間,OpenAI的發布會把AI界炸了一圈,還上演了一出“宮斗劇”,甚至還傳出讓人浮想聯翩的Q*,谷歌都沒一點新消息,差點就讓人以為AI圈的王者已定。

就在一個月之前,英偉達科學家Jim Fan就曾說過,“人們對谷歌Gemini的期望高得離譜!谷歌要想重奪當年AlphaGo的輝煌,Gemini不僅要100%達到GPT-4的能力,還要在成本或者速度上比GPT-4更好。”

wKgZomVx5m-ARkC3AAMUeHCh2m0257.jpg

生來就是全才

還好,從Gemini公布的演示視頻來看,它沒讓人失望。

“Gemini,從第一天起就是多模態大模型——跨越文本、圖像、視頻、音頻和代碼的無縫推理。”這是谷歌官網上,介紹Gemini的第一句話。

與ChatGPT通過升級迭代,逐步加上視覺、音頻等多模態能力,形成“合體金剛”的路徑不同,Gemini生來就是一位全才。它從第一天起就被設計成原生多模態結構,文本、圖像、音視頻能力從最開始就一起訓練,從這一點上來看,Gemini的學習更像人類。這就意味著,Gemini可以無縫調動多模態能力,抽象和理解、操作和組合不同類型的信息。

舉個例子,如果你同時上傳一張圖片給ChatGPT和Gemini,那么ChatGPT的處理將會是這樣的,先借助GPT-4V認出來圖里是什么,然后轉成文本交給GPT去進行語義理解,然后再作回答;而Gemini則可以基于圖像直接進行理解并回應,不用進行不同模型之間的調動。因此,在實操過程中,Gemini可以減少信息的丟失,回應也可以更加迅速和絲滑。

這從谷歌給到的演示視頻中便可以看出:

wKgaomVx5m-ATxr4AAaNqEAfdFk912.jpg

演示者一邊畫畫,Gemini就可以一邊辨認,并且用自然、流利的語音和演示者對話,在演示者拿出藍色的玩具鴨實物后,它還會幽默的回應:“看起來藍色的鴨子比我想象中更常見。”

很顯然,這樣的體驗更接近漫威中的“賈維斯”——一個高級人工智能,能與人類自如地進行交互。

而這樣的體驗,離不開Gemini的原生多模態架構

Gemini VS GPT-4

除了擁有令人驚嘆的原生多模態能力,在性能上,Gemini也是相當強悍

按照尺寸的不同,Gemini共有“中杯”、“大杯”還有“超大杯”三種,即Ultra、Pro和Nano三個不同的版本。它們在性能和適配任務上的側重點各有不同。

wKgZomVx5nCAAlrsAAQdwAiMIp4903.jpg

·Gemini Ultra —規模最大且功能最強大的模型,適用于高度復雜的任務,預計2024年初推出。

·Gemini Pro — 適用于各種任務的最佳模型,已經被用在了谷歌聊天機器人Bard的升級版上。

·Gemini Nano — 可以在端端側設備上運行的高效模型,已經可以跑在谷歌Pixel 8 Pro手機上了。

根據谷歌給到的資料,從自然圖像、音頻和視頻理解,再到數學推理,Gemini Ultra的性能在32個常見的大語言模型(LLM)研究和開發的學術基準測試中,拿下了30個SOTA

其中,它在通用、推理、數學和編程等大方向的成績如下:

wKgaomVx5nCAIyIhAANdlxvRA2o279.jpg

更讓人驚奇的是,在MMLU(大規模多任務語言理解)任務上,Gemini Ultra的得分達到了90.0%,超越了人類專家89.8%的成績,首次達到了超越人類專家水平

wKgZomVx5nGASGIoAAD4e_iIynk849.jpg

MMLU測試包括數學、物理、歷史、法律、醫學等57個學科,主要是用來考察大語言模型世界知識和解決問題的能力,而在這些學科中的每一個,Gemini都達到了甚至超過了行業專家的水準。

在圖像基準測試中,Gemini Ultra在不使用OCR(對象字符識別)來提取圖像文本進行下一步處理的情況下,表現優于GPT-4V

各種測試都表明,Gemini在多模態處理上表現出了強大的能力,并且在更復雜的推理上也有很大的潛力。

實際能力被質疑

然而,在模型發布后不久,就有人在谷歌給到的60頁技術報告中發現了一些“小技巧”。

在MMLU測試中,Gemini的結果下面用灰色小字標注著CoT@32,這表示,這個結果是使用了思維練提示技巧,嘗試了32次后選出來的最好結果,而對比GPT-4,則是無提示詞技巧,只嘗試了5次的結果,這測試結果,變量確實控制得不是很好。

wKgaomVx5nKACzbBAACicmHlaP0009.jpg

而且在顯示超越人類專家的示意圖里,比例尺上也有問題,讓人以為超越了人類專家很多,但實際上并沒有相差多少。

HuggingFace的技術主管Philipp Schmind“修復”了這張圖,表示實際上應該是這樣:

wKgZomVx5nKAaE0IAALmdPXcCwY271.jpg

并且,在谷歌給到的一篇解釋多模態交互過程的博客中,似乎表明了演示視頻里,Gemini實時互動并不是真的,而是使用了靜態圖片,通過多段提示詞拼湊,最后再剪輯視頻,才達到了演示視頻里的效果。

wKgaomVx5nOANtJfAALLPAPOdSk302.jpg

不管谷歌是不是有意使用“障眼法”,Gemini的發布無疑給看似穩定的AI界帶來了一些“動蕩”。

并且,谷歌還宣布推出了迄今為止最強大、最高效、最可擴展的TPU系統:Cloud TPU v5p,Gemini正式在此基礎上訓練的,這意味著谷歌將有能力拜托英偉達的算力限制,也算給了AI芯片市場帶來了一些變化。

大模型的多模態探索

隨著ChatGPT通過升級迭代,擁有了多模態能力,以及Gemini所展現出來的原生多模態能力,我們可以清晰地感受到,AI大模型浪潮已經進入了一個全新的階段,即從大語言模型轉向多模態模型。后者將更符合人類和世界交互最自然的方式:用眼睛看,用耳朵聽,用嘴巴說,用文字記錄與決策。

wKgaomVx5nSAT2CIAAmclVNR7hE455.jpg

多模態領域的技術探索,與互聯網媒介形式的變化也十分吻合,即從文字媒體,再到

音視頻媒體。如今,隨著抖音以及TikTok等短視頻平臺的興起,視頻已經成為了我們這個信息時代的主流。

根據思科的年度互聯網報告,視頻已經占據了互聯網超過80%的流量

很明顯,如果一個AI大模型不具備識別圖像以及音視頻的能力,那么其訓練數據將會跟不上信息迭代的速度,其能力也將大打折扣。

現如今,在多模態模型道路的探索上,除了GPT,Gemini也加入了進來,不知道未來Meta的Llama還有馬斯克的Grok等等,是否也將加入角逐?


審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    74

    瀏覽量

    8146
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301355
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16869
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5179
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌AI霸主歸來!線反擊OpenAI,開啟安卓Gemini時代

    電子發燒友網報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發者大會正式召開,從其發布的新品來看,這可以說是一場AI盛會。 在AI大模型方面,
    的頭像 發表于 05-22 09:01 ?6637次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主歸來!<b class='flag-5'>多</b>線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時代

    Gemini CLI 中轉站配置使用教程

    Gemini CLI 中文使用指南 基本介紹 Gemini CLI 是谷歌提供的開源命令行 AI 工具,將 Gemini 的強大功能直接帶入
    發表于 02-10 17:29

    商湯科技正式開源模態自主推理模型SenseNova-MARS

    今日,商湯正式開源模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在模態搜索與推理的核心基準測試中以 69.74 分超越
    的頭像 發表于 01-30 10:13 ?517次閱讀
    商湯科技正式開源<b class='flag-5'>多</b><b class='flag-5'>模態</b>自主推理模型SenseNova-MARS

    商湯開源SenseNova-MARS:突破模態搜索推理天花板

    今日,商湯正式開源模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在模態搜索與推理的核心基準測試中以 69.74 分超越
    的頭像 發表于 01-29 23:53 ?151次閱讀
    商湯開源SenseNova-MARS:突破<b class='flag-5'>多</b><b class='flag-5'>模態</b>搜索推理天花板

    晶晨攜手谷歌,助力端側大模型Gemini的硬件落地

    電子發燒友網報道 在科技飛速發展的當下,端側智能技術正以前所未有的速度滲透到各個領域。1月28日,晶晨股份透露,公司與谷歌有著長達十余年的深度合作基礎。作為谷歌新一代端側AI硬件(整合Gemi
    的頭像 發表于 01-29 10:44 ?1291次閱讀

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協議,下一代蘋果基礎模型(Apple Foundation Models)將基于谷歌Gemini模型和云技術。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在
    的頭像 發表于 01-13 14:59 ?1547次閱讀

    涂鴉Omni AI Foundation V2.6發布:低代碼+模態,重塑AI硬件創新體驗

    硬件產品的落地。今天,我們非常高興地宣布:面向模態AI硬件的基座平臺OmniAIFoundation正式發布V2.6版本。本次升級不僅顯著提升了端到端
    的頭像 發表于 12-24 18:58 ?427次閱讀
    涂鴉Omni <b class='flag-5'>AI</b> Foundation V2.6<b class='flag-5'>發布</b>:低代碼+<b class='flag-5'>多</b><b class='flag-5'>模態</b>,重塑<b class='flag-5'>AI</b>硬件創新體驗

    Gemini AI 再進化:谷歌聯合XREAL發布Project Aura, 打開“看見世界”的新能力

    被定位為迄今為止最完整、最接近 Android XR 理想形態的硬件樣本。作為谷歌官方認可的系統級參考硬件,Project Aura 標志著 Gemini AI 第一次真正擁有“看見世界”的能力
    發表于 12-09 11:06 ?1263次閱讀
    <b class='flag-5'>Gemini</b> <b class='flag-5'>AI</b> 再進化:<b class='flag-5'>谷歌</b>聯合XREAL<b class='flag-5'>發布</b>Project Aura, 打開“看見世界”的新能力

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實現任何創意。Gemini 3 Pro 基于最先進的推理技術,與之前的版本相比,它在所有主要的 AI 基準測試中都取得了無與倫比的結果,尤其是在編程方
    的頭像 發表于 11-24 11:10 ?1217次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新<b class='flag-5'>Gemini</b> 3 <b class='flag-5'>AI</b>模型

    商湯日日新V6.5模態大模型登頂全球權威榜單

    Pro)模態大模型以82.2的綜合成績登頂榜首,領先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。
    的頭像 發表于 09-10 09:55 ?786次閱讀

    成都匯陽投資關于大模型白熱化,應用加速分化

    ? ? ? ?大模型: 加速模態研發 ,閉源模型逐步逆襲開源 模態技術路線尚未收斂 , 國內外大模型廠商持續刷新 SOAT。 圖片領域 ,GPT
    的頭像 發表于 09-09 09:30 ?917次閱讀

    “端云+模態”新范式:《移遠通信AI大模型技術方案白皮書》正式發布

    7月28日,移遠通信聯合智次方研究院正式發布AI大模型技術方案白皮書》(以下簡稱“白皮書”)。這份白皮書系統梳理了AI大模型的技術特點、產業發展態勢與多元應用場景,以及移遠通信“端云+
    的頭像 發表于 07-28 13:08 ?1224次閱讀
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模態</b>”新范式:《移遠通信<b class='flag-5'>AI</b>大模型技術方案白皮書》正式<b class='flag-5'>發布</b>

    百度文心快碼推出AI原生開發環境工具Comate AI IDE

    6月23日圖靈誕辰日,Comate AI IDE正式發布,成為行業首個模態智能體協同的獨立AI
    的頭像 發表于 06-27 11:30 ?1164次閱讀

    Android Studio中的Gemini支持模態輸入功能

    Gemini 現已支持模態輸入,您可在提示中直接添加圖像!這為團隊協作和界面開發工作流程解鎖了更多新的可能性。
    的頭像 發表于 05-14 16:44 ?1175次閱讀

    海康威視發布模態大模型AI融合巡檢超腦

    基于海康觀瀾大模型技術體系,海康威視推出新一代模態大模型AI融合巡檢超腦,全面升級人、車、行為、事件等算法,為行業帶來全新的模態大模型巡
    的頭像 發表于 04-17 17:12 ?1611次閱讀