国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

單日獲客成本超20萬,國產大模型開卷200萬字以上的長文本處理

E4Life ? 來源:電子發燒友 ? 作者:周凱揚 ? 2024-03-27 00:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)隨著AGI生態的蓬勃發展,各種支持多模態的大模型推陳出新,比如最近比較火的音樂大模型Suno和文生視頻大模型Sora等等。然而在傳統基于文本的大語言模型上,除了追求更快更精準的推理和高并發流量以外,似乎已經沒有太多值得廠商大肆宣傳的特性了,直到最近超長文本處理的爆火。

國產大模型的新卷法,長文本處理

當下將大模型長文本處理炒熱的,無疑是來自月之暗面的Kimi。作為去年發布的大模型,Kimi的主要賣點就是長文本,當時發布的初版Kimi,就已經支持到最多20萬漢字的輸入處理。

然而僅僅20萬字的文本處理,還不至于給用戶帶來質變的交互體驗,畢竟GPT-4 Turbo-128k已經支持到約合10萬漢字的長文本處理,谷歌的Gemini pro也支持到最多70萬個單詞的上下文,但不少長篇小說、專業書籍的字數要遠超這一數字。

wKgZomYCneCAMb8qAAM8v3nPbSs784.jpg
Kimi支持200萬字上下文 / 月之暗面

Kimi在最近爆火源于一項重大迭代升級,月之暗面將長文本處理的字數限制擴展到200萬字,遠超Claude3、GPT-4 Turbo和Gemini Pro模型。在新功能推出和有效推廣下,Kimi很快涌入了一大批用戶,其app甚至短暫地沖進了蘋果App Store前五的位置。然而這樣也對Kimi的運營造成了不小的壓力,Kimi在上周經歷了多次宕機,這還是在月之暗面對服務器連續擴容的前提下。

面對競爭對手Kimi的用戶量激增,阿里巴巴和360很快就坐不住了。3月22日,阿里巴巴宣布通義千問將向所有用戶免費開放1000萬字的長文檔處理功能;3月23日,360智腦宣布正式內測500萬字長文本處理功能,且該功能即將入駐360 AI瀏覽器。

除了阿里巴巴和360外,目前國內訪問量第一的百度文心一言據傳也會在下月開放長文本處理功能,并計劃把字數上限提高至200萬甚至500萬字。

超長文本實現的技術難點和商業桎梏

盡管在用戶看來,阿里巴巴、360等廠商宣布支持超長文本處理好像是一件無需多少時間的易事,但實際上超長文本處理的實現存在不少技術痛點和商業成本問題。要知道在2022年,絕大多數的LLM上下文長度最多也只有2K,比如GPT-3。

直到GPT-4和Claude 2等,這些大模型才從架構上對文本長度進行了優化,可即便如此,主流的文本輸入長度依然不會超過100K。這也是因為對部分大模型而言,長文本不一定代表著更好的使用體驗,尤其是在查全率和準確率上。

wKgaomYCne6ABP4QAADkljohAv4132.png
Claude的上下文長度和召回率關聯圖 / Anthropic


以Anthropic給出的數據為例,從上圖可以看出,隨著文本長度的增加,召回率是在逐步降低的,即便是最新的Claude3也是如此,而召回率代表了檢索出相關信息量占總量的比率。至于精確度,則與上下文中的事實位置存在很大的關系,如果用戶問題的事實存在于文本開頭或后半部分的位置,那么更容易得到精確的結果,而位于10%到50%之間位置的文本,則精確度急劇下降。

除此之外,長文本對于GPU和內存的資源消耗太大了,即便是小規模地擴展文本長度,動輒也要消耗100塊以上的GPU或TPU,這里指代的GPU還是A100這種單卡顯存容量高達40GB或80GB的設備。

這也是Kimi在經歷大量用戶訪問后,需要緊急擴容的原因。而阿里巴巴之所以能這么快開放長文本能力,也是憑借著手握龐大的服務器資源。至于Anthropic,我們從Claude3 Opus高昂的Tokens價格,也可以猜到其硬件成本絕對不低。

另外,在持續火爆一年之后,目前的大模型應用也難以單純靠技術立足市場吸引用戶了,商業推廣也已經成了必行之路。就以Kimi為例,在社交媒體上有關該應用的推廣可謂鋪天蓋地,很明顯對于新興的大模型應用而言,收獲第一批用戶才是至關重要的。

據傳Kimi在廣告投放上,吸引每位新用戶的花費在10元左右,而新用戶參與到使用中帶來的額外算力開銷在12元至13元左右。如果單單只是根據手機平臺app的下載量計算,那么Kimi的每日獲客成本至少為20萬人民幣,而這還未計算來自網頁端和小程序端的用戶。

wKgZomYCnf2AOjdbAADS5hsoY5M413.png
AI產品國內總榜 / AI產品榜


而且Kimi的推廣也不是從200萬長文本功能的推出才開始的,早在二月份Kimi就開始以長文本這一特性加強商業推廣了。從AI產品榜中可以看出,Kimi在2月的訪問量飆升,在國內總榜中僅次于百度文心一言和阿里通義千問,足見其在商業推廣和產品運營上都下了血本。但相對ChatGPT和New Bing之類的應用而言,其訪問量還是存在很大的差距。

這也充分說明了為何國外的大模型應用沒有去卷200K以上文本長度的原因,目前算力、準確度和長文本之間的沖突限制了他們去發展長文本。但這對于中國的大模型應用來說,反而是一個彎道超車的機會,因為大模型上的長文本能力確實帶來了用戶體驗上的改變。

長文本對于用戶體驗的改變

國產大模型為什么要去卷長文本,這是一個與大模型應用落地息息相關的問題。在過去,正是由于長文本能力不足,絕大多數大模型應用才會給人不堪大用的感覺,比如虛擬助手由于長文本能力不足,會遺忘重要信息;基于大模型來設計劇本殺等游戲規則時,上下文長度不夠只能在規則和設定上縮水,從而簡化游戲難度;在論文分析和法律法規解讀這樣的關鍵領域,更是因為缺乏長文本的支持,無法給到用戶精準的答案。

這與大模型卷參數規模不同,因為用戶已經發現了即便是70B這個量級的大模型,在面對用戶的問題時,也會出現胡編亂造的問題。反倒是長文本提供了更多的上下文信息,大模型在對語義進行分析判斷后,會提供更加精確的答案,所以不少用戶才會借助Kimi來分解長篇小說、總結論文等。

不過在享受長文本處理帶來便利的同時,我們也應該注意下長文本處理背后潛在的信息安全和版權問題。對于過去短文本的處理,就已經存在一些可能暴露用戶真實身份和隱私信息的問題,隨著長文本支持對于更大文件和更長文本的處理,有的人可能會選擇將合同、條例或標準等包含敏感信息的專業文件上傳到大模型上,又或是引入一些盜版文檔資源。

所以國家層面也開始出臺各種管理辦法,對于大模型語言模型在內的生成式人工智能進行規范,不能侵犯知識產權并保護個人隱私。如此一來,對于大模型應用本身的信息脫敏也提出了更高的要求。

寫在最后

相信經過一年的大模型應用轟炸后,不少用戶對于基本的AGI玩法已經玩膩了,所以長文本、文生視頻這種新的交互方式才會讓人趨之若鶩。但我們也很少看到成功的長文本大模型商業化落地項目,畢竟在高額的獲客成本下,RAG這種外掛知識庫的方式可能更適合手中資金有限的初創AGI應用開發商。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Agi
    Agi
    +關注

    關注

    0

    文章

    101

    瀏覽量

    10819
  • 大模型
    +關注

    關注

    2

    文章

    3648

    瀏覽量

    5176
  • LLM
    LLM
    +關注

    關注

    1

    文章

    346

    瀏覽量

    1329
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中科曙光3套scaleX集群落地國家算互聯網鄭州核心節點

    2月5日,由中科曙光提供的3套集群系統在國家算互聯網鄭州核心節點同時上線試運行,成為全國首個實現3卡部署、且實際投入運營的最大國產
    的頭像 發表于 02-09 10:32 ?459次閱讀

    Linux Shell文本處理神器合集:15個工具+實戰例子,效率直接翻倍

    在 Linux 系統中,文本是數據交互的 “通用語言”—— 日志文件、配置文件、數據報表、程序輸出幾乎都以文本形式存在。手動編輯文本不僅繁瑣,還容易出錯,而掌握 Shell 文本處理
    的頭像 發表于 02-03 15:42 ?1458次閱讀
    Linux Shell<b class='flag-5'>文本處理</b>神器合集:15個工具+實戰例子,效率直接翻倍

    Neway微波國產化替代方案

    關鍵技術指標上已與進口產品持平,同時采購成本降低30%-45%。通過優化拓撲結構和散熱設計,國產模塊在高溫老化測試中展現出更穩定的性能曲線,MTBF(平均無故障時間)突破10小時。電源模塊優化降低
    發表于 01-30 08:45

    部分能力超越2027年NVL576,中科曙光發布scaleX集群

    2025年12月18日,在昆山舉行的光合組織2025人工智能創新大會(HAIC2025)上,中科曙光發布并展出了全球領先的大規模智能計算系統——scaleX集群,這也是國產卡級
    發表于 12-18 18:30 ?1095次閱讀
    部分能力超越2027年NVL576,中科曙光發布scaleX<b class='flag-5'>萬</b>卡<b class='flag-5'>超</b>集群

    禾賽科技激光雷達已累計交付200

    今日,全球激光雷達領導者禾賽科技(NASDAQ: HSAI;HKEX: 2525)宣布,公司累計第 200 臺激光雷達已于 11 月中旬在禾賽麥克斯韋智造中心正式量產下線并交付客戶。禾賽成為全球首個累計量產并交付
    的頭像 發表于 11-17 15:47 ?2214次閱讀

    萬字長文AI智能體:17種體架構詳細實現

    數據科學AI智能體領域發展迅猛,但許多資源仍然過于抽象和理論化。創建此項目的目的是為開發者、研究人員和AI愛好者提供一條結構化、實用且深入的學習路徑,以掌握構建智能系統的藝術。
    的頭像 發表于 11-07 13:16 ?548次閱讀
    <b class='flag-5'>萬字長文</b>AI智能體:17種體架構詳細實現

    廣和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,廣和通在MediaTek MT8893平臺上成功部署并運行了DeepSeek-R1-0528-Qwen3-8B模型,顯著提升了端側AI設備的處理效率與智能化水平,特別是在本地化復雜文本處理
    的頭像 發表于 09-26 13:35 ?861次閱讀

    3萬字長文!深度解析大語言模型LLM原理

    我們正在參加全球電子成就獎的評選,歡迎大家幫我們投票~~~謝謝支持本文轉自:騰訊技術工程作者:royceshao大語言模型LLM的精妙之處在于很好地利用數學解決了工業場景的問題,筆者基于過往工程經驗
    的頭像 發表于 09-02 13:34 ?3448次閱讀
    3<b class='flag-5'>萬字長文</b>!深度解析大語言<b class='flag-5'>模型</b>LLM原理

    產品拆解 | 添可芙“極”洗地機(上):AI 全向助力如何實現?

    2個滾輪電機、1個滾刷電機、1個風機、1個水泵,5個電機的電控和主控方案應該如何設計?“AI全向助力”怎么實現?元器件國產比例如何?本期拆解添可芙8月新品極洗地機的設計方案思路,看看國產
    的頭像 發表于 08-25 16:24 ?3079次閱讀
    產品拆解 | 添可芙<b class='flag-5'>萬</b>“極<b class='flag-5'>客</b>”洗地機(上):AI 全向助力如何實現?

    產品拆解 | 添可芙“極”洗地機(下)

    收納底座如何同時完成烘干、風干和充電三大功能?電池管理模塊在充放電控制與安全保護上采用了怎樣的設計?國產功率器件和控制芯片在其中的占比如何?本期拆解下篇聚焦添可芙洗地機的電源與BMS方案。 在
    的頭像 發表于 08-25 16:23 ?2101次閱讀
    產品拆解 | 添可芙<b class='flag-5'>萬</b>“極<b class='flag-5'>客</b>”洗地機(下)

    小馬智行L4域控制器路測200公里

    近日,小馬智行宣布第七代Robotaxi所搭載的L4車規級域控制器已累計測試200公里。作為全球首個L4 Robotaxi車規級量產域控制器,200
    的頭像 發表于 07-26 09:14 ?1115次閱讀

    萬字全文科普:什么是IP?

    半導體行業在一個復雜且快速發展的生態系統中運作,并由持續創新驅動。該生態系統的核心是半導體價值鏈,它包含幾個關鍵階段:芯片設計、晶圓制造、最終組裝和原材料采購。每個階段對于半導體器件的生產和功能都至關重要。IP提供商在這一框架中發揮著關鍵作用,尤其是在芯片設計階段,該階段是整個價值鏈的基礎。他們提供專業的尖端技術,以增強創新、促進無縫集成、確保合規性并加快產
    的頭像 發表于 07-21 09:53 ?1129次閱讀
    <b class='flag-5'>萬字</b>全文科普:什么是IP?

    萬字長文】物聯網的激蕩二十年

    2005年11月,在突尼斯舉辦的信息社會世界峰會(WSIS)上,國際電信聯盟(ITU)發布了一份名為《ITU互聯網報告2005:物聯網》,正式向世人展示了什么是“物聯網(InternetofThings)”。雖然業界一致認為,1999年,麻省理工學院的KevinAshton首次提出”物聯網”這一術語,但僅僅只是一個理念,沒有成體系的解釋,也無法形成共識。而I
    的頭像 發表于 06-27 13:42 ?1599次閱讀
    【<b class='flag-5'>萬字長文</b>】物聯網的激蕩二十年

    Linux中文本處理命令的用法

    Linux 三劍是(grep,sed,awk)三者的簡稱,熟練使用這三個工具可以提升運維效率。Linux 三劍以正則表達式作為基礎,而在Linux系統中,支持兩種正則表達式,分別為“標準正則表達式”和“擴展正則表達式”。在掌握好正則表達式后,將具體講解三劍
    的頭像 發表于 04-15 10:22 ?759次閱讀
    Linux中<b class='flag-5'>文本處理</b>命令的用法

    國產首款量產型七位半用表!青島漢泰開啟國產高精度測量新篇章。

    國產首款量產型七位半用表!青島漢泰開啟國產高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數字用表。HDM3075系列是
    發表于 04-01 13:15