国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新火種AI | 谷歌Gemini“抄襲”百度文心一言?AI訓練數據陷難題

新火種 ? 來源:新火種 ? 作者:新火種 ? 2023-12-20 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:一號

編輯:小迪

谷歌過于心急,Gemini推出不到半月,就遭遇兩次“危機”。

美東時間12月6日,谷歌推出了迄今為止規模最大,能力最強的大模型Gemini。其原生多模態的能力,通過一條約6分鐘的演示視頻,展現得淋漓盡致,讓人不得不感慨它的強大,就連馬斯克都評論說,“(Gemini)令人印象深刻”。

谷歌在AI領域的成就有目共睹,盡管之前推出的Bard表現不盡人意,讓谷歌市值一夜蒸發了1000億美元。但經過一年沉淀,加上和DeepMind聯合研發,所以Gemini(雙子星)可是被寄予了厚望。

但是,Gemini發布后僅一天,就有人指控谷歌“造假”。除了在數據對比上沒有使用相同條件,演示視頻效果也是經過剪輯的。逼得谷歌不得不給出文檔承認視頻是經過加工的。

12月14日,視頻“造假”事件還沒降溫,谷歌就宣布對外免費開放Gemini Pro的API。讓不少人高興得奔走相告。因為相較于GPT-4收費版才能擁有的視覺模型,Gemini Pro可以直接給平民AI玩家體驗AI視覺能力的機會。

但就在API開放后不久,就有用戶發現,在Poe上使用Gemini Pro時,如果用簡體中文連續詢問“你好”和“你是誰”這兩個問題時,Gemini Pro會直接說出“我是百度文心大模型”這樣的回答,給網友都看“呆”了。

谷歌Gemini被百度文心一眼“奪舍”了?

微博大V闌夕就發博展示了這樣的效果,就連進一步詢問“你的創始人是誰”時,它也很干脆地回答:李彥宏。

wKgZomWBqMqAfHd-AAQRnmzppkY379.jpg

難道Gemini被百度“奪舍”了?不少人懷疑這是因為博主在對話前面設置了提示詞,讓Gemini扮演文心一言,但這位博主強調,沒有任何前置對話。

wKgaomWBqMuAEsG6AAFYsarFxxM625.jpg

本著求真的態度,我們也去Poe上試用了一下,結果真的可以復現。

wKgZomWBqMuAAcdgAAP589GT9k0828.jpg

會不會是Poe平臺上的接口用錯了?不過Poe平臺可不是什么野雞套殼網站,它是美版知乎Quora推出的AI聊天機器人平臺,你所熟知的ChatGPT、Claude等知名AI都可以在上面使用。而且如果你使用英文提問Gemini,它就會立刻恢復正常。并且單就從“作案動機”上來講,Poe也沒有必要這么做。

除此之外,還有用戶在谷歌自己的Vertex AI平臺上,使用中文對話,也出現了這種情況。因此,Poe的接口使用出錯,這個可能基本可以被排除,問題應該出在Gemini本身。

wKgaomWBqMyAODq1AACIPl0BLUc359.jpg

使用AI生成的數據進行訓練已不新鮮

這樣看下來,要么就是谷歌使用了百度文心一言的語料進行訓練,要么就是它所使用的語料已經被AI“污染”了。

其實大模型訓練使用其他大模型生成的語料這件事情已經不是第一次發生,并且谷歌還是有“前科”的。在上一代Bard時,谷歌就曾被曝出使用ChatGPT的數據進行訓練,并且根據The Information報道,這件事情還造成了Jacob Devlin從谷歌離職。

就在上周末,字節跳動也被OpenAI禁止使用API接口,原因也是因為說字節在使用GPT訓練自己的AI,違反了使用條例。

wKgZomWBqMyAPJd4AAJ1abXz8sA239.jpg

如果按照現在每個模型堆“訓練數據量”的操作來看,互聯網上的人類原生的數據很快就會用完,并且各個模型之間也將會很相似。因此,獲取一些未被別人拿去訓練的數據,是模型之間保持差異化的一種方法。因此,有些AI公司會向一些擁有專屬數據的公司購買數據。例如OpenAI就曾表示愿意每年支付高達八位數的費用,用以獲取彭博社自有的歷史和持續的金融文件數據訪問權限。

wKgaomWBqM2AIpbBAAMBO88ElR0114.jpg

另一個思路,就是選擇使用AI合成的數據來進行訓練。香港大學、牛津大學和字節跳動的幾名研究院就曾嘗試過使用高質量AI合成圖片,來提升圖像分類模型的性能,結果發現效果還不錯,甚至比真實數據訓練還要好。

AI生成的內容正在“污染”互聯網

而從另一方面來看,AI生成的內容污染互聯網也是一個不得不重視的問題了。尤其是生成式AI大爆發的今年。在文字、圖像、視頻還有音頻等領域,AI生成的內容都正在“污染”互聯網上數據內容。

就在上個月,一些網友發現,在谷歌搜索上輸入已故夏威夷歌手Israel Kamakawiwo’ole的名字是,得到的搜索結果,前幾張圖片都是有AI生成的,而并非真實照片,并且這是一位以彈奏尤克里里而聞名的音樂家,但圖片里的他卻在彈吉他。

在文字方面也是,隨著百家號等媒體平臺上出現的AI幫寫等功能,AI生成的文章已經開始在互聯網上“蔓延”,這讓普通人在互聯網上篩選真實且有效的信息的效率反而降低了??梢哉f,AI生成內容對互聯網語料的“污染”,可能會導致產生一個新的需求,那就是幫人們分辨內容是否由AI生成的AI。

畢竟,目前訓練AI所需要的數據還是人類所生產的,在數據清洗過程中,需要注意清除一些由其他AI生成的內容。一旦互聯網上AI生成的內容越多,越能以假亂真,那么數據篩選的難度將越大。并且在大模型出現“幻覺”以及AI如何產生“智能涌現”這兩個問題沒有得到徹底解決之前,我想我們都無法做到徹底信賴AI生成的內容。

畢竟一旦AI生成了錯誤的內容,而另一個AI拿著這個內容去訓練,然后再另一個AI拿到新的錯誤內容......這樣“滾雪球”下去,AI最終會生成什么樣的逆天垃圾,我們真的無法想象。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    74

    瀏覽量

    8146
  • AI
    AI
    +關注

    關注

    91

    文章

    39755

    瀏覽量

    301352
  • 文心一言
    +關注

    關注

    0

    文章

    134

    瀏覽量

    2176
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度大模型5.0正式版上線

    今天,在百度Moment大會現場,大模型5.0正式版上線。
    的頭像 發表于 01-23 16:48 ?1279次閱讀

    百度健康升級發布健康管家

    面臨醫療資源分布不均、就診流程繁瑣、就醫信息不均等難題,“想讓每個家庭都擁有專屬醫生”成為百度健康的愿景。
    的頭像 發表于 12-23 15:01 ?678次閱讀

    百度世界大會亮點 五年五芯 百度宣布打造最硬AI

    年,持續為行業搭建起交流前沿技術、碰撞創新思維、洞察未來趨勢的重要平臺。 今日(11月13日)Baidu World 2025在北京舉辦。在這里,可以體驗AI應用的價值涌現,見證AI能力的創新爆發。 今年的百度世界2025以“效
    的頭像 發表于 11-13 15:47 ?1596次閱讀

    百度智能云發布全球首批AI數字員工

    沒錯,在今天的百度AI Day開放日現場,這么溜的同事們正式上崗!
    的頭像 發表于 08-12 09:47 ?1708次閱讀

    寧暢與與百度大模型展開深度技術合作

    近日,百度正式開源大模型4.5系列模型。作為開源合作伙伴,寧暢在模型開源首日即實現即刻部署,做到“開源即接入、發布即可用”。據悉,
    的頭像 發表于 07-07 16:26 ?869次閱讀

    百度地圖重磅發布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發布地圖AI開放平臺。百度地圖深耕20年的數據能力、引擎能力與AI技術全面開放,向開發者
    的頭像 發表于 05-26 11:26 ?1735次閱讀

    百度大模型X1 Turbo獲得信通院當前大模型最高評級證書

    百度在520居然還領了個證?是它, 信通院當前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結果—— 百度
    的頭像 發表于 05-21 18:19 ?1267次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>文</b><b class='flag-5'>心</b>大模型X1 Turbo獲得信通院當前大模型最高評級證書

    如何賦能醫療AI大模型應用?

    引言自ChatGPT掀起熱潮以來,眾多AI大模型如雨后春筍般涌現,其中包括百度科技的一言、科大訊飛的訊飛星火、華為的盤古
    的頭像 發表于 05-07 09:36 ?681次閱讀
    如何賦能醫療<b class='flag-5'>AI</b>大模型應用?

    百度發布4.5 Turbo、X1 Turbo和多款AI應用

    近日,Create2025百度AI開發者大會在武漢舉辦。百度創始人李彥宏發布了大模型4.5 Turbo及深度思考模型X1 Turbo兩大
    的頭像 發表于 04-30 10:16 ?1141次閱讀

    百度AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度AI領域的新進展。
    的頭像 發表于 04-30 10:14 ?1330次閱讀

    格靈深瞳亮相Create2025百度AI開發者大會

    近日,Create2025百度AI開發者大會在武漢體育中心圓滿落幕,作為全球首個AI開發者大會,Create2025百度AI開發者大會至今已
    的頭像 發表于 04-29 16:12 ?1053次閱讀

    海思SD3403邊緣計算AI數據訓練概述

    模型,將模型轉化為嵌入式AI模型,模型升級AI攝像機,進行AI識別應用。 AI訓練模型是不斷迭代優化過程,譬如,100個
    發表于 04-28 11:11

    百度快碼3.5升級,智能代碼助手正進入多模態智能體時代

    日,百度Create AI開發者大會舉行,在六大分會場中特設《如何駕馭Coding Agent》分會場,邀多位產業界、學術界、開發者社區的線實踐者,共同揭秘探討Coding Agent未來
    的頭像 發表于 04-28 09:43 ?598次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>文</b><b class='flag-5'>心</b>快碼3.5升級,智能代碼助手正進入多模態智能體時代

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得銀兩項大獎。
    的頭像 發表于 04-08 15:43 ?973次閱讀

    百度發布大模型4.5和文大模型X1

    大模型4.5是百度自主研發的新代原生多模態基礎大模型,通過多個模態聯合建模實現協同優化,多模態理解能力優秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯
    的頭像 發表于 03-18 16:29 ?897次閱讀