微軟研究院近期公開發(fā)布了Phi-3系列AI模型,該系列包括mini版(38億參數(shù))、small版(70億參數(shù))以及medium版(140億參數(shù))。
微軟稱,帶有38億參數(shù)的phi-3-mini經(jīng)過3.3萬億token的強化學(xué)習(xí),其基礎(chǔ)表現(xiàn)已經(jīng)超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機等移動設(shè)備上運行,并在phi-2模型(27億參數(shù))的基礎(chǔ)上,進一步融合了嚴(yán)格篩選的網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù)。
盡管phi-3-mini在語言理解和推理方面已能匹敵大參數(shù)模型,但在TriviaQA等特定任務(wù)中仍受限于模型規(guī)模。
值得注意的是,phi-3-small和phi-3-medium兩款模型在MMLU測試中的得分分別達到了75.3和78.2。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
微軟
+關(guān)注
關(guān)注
4文章
6741瀏覽量
107852 -
移動設(shè)備
+關(guān)注
關(guān)注
0文章
528瀏覽量
55942 -
強化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
270瀏覽量
11967
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍
電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月8日凌晨1點,OpenAI以一場長達1小時的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進化分水嶺”的發(fā)布,終結(jié)了長達兩年的技術(shù)猜測,
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
今日,通義千問團隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Q
美格智能高算力AI模組+Qwen3.5,打造端側(cè)最強AI智能體
”提供強大的算力底座,成為解鎖AI原生應(yīng)用的關(guān)鍵。QWEN3.5開發(fā)者友好,適合本地部署近期,Qwen3.5系列模型的發(fā)布,為
阿里巴巴開源全新一代大模型千問Qwen3.5-Plus
千問3.5實現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過萬億參數(shù)
微軟發(fā)布AI芯片Maia 200,性能超越谷歌TPU和亞馬遜Trainium
。 ? Maia 200采用臺積電先進的3納米工藝制造,現(xiàn)已開始部署至愛荷華州的數(shù)據(jù)中心,后續(xù)還將進駐鳳凰城地區(qū)。微軟云與AI業(yè)務(wù)負(fù)責(zé)人Scott Guthrie在博客文章中宣稱,Maia 200是“
GPT-5.1發(fā)布 OpenAI開始拼情商
OpenAI正式上線了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實測發(fā)現(xiàn)OpenAI新發(fā)布的GPT
微軟Visual Studio 2026 發(fā)布!AI 深度融合、性能提升
“ ?微軟發(fā)布 Visual Studio 2026 預(yù)覽版,新版本以深度融合的 AI Copilot 為核心,結(jié)合全新的 Fluent Design 界面與顯著的性能提升,旨在打造前
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現(xiàn)150萬TPS推理
的發(fā)布持續(xù)深化了雙方的 AI 創(chuàng)新合作。NVIDIA 在 NVIDIA Blackwell 架構(gòu)上優(yōu)化了這兩款全新的開放權(quán)重模型并實現(xiàn)了推理性能加速,在 NVIDIA 系統(tǒng)上至高達到每
微軟企業(yè)級應(yīng)用AI能力全面升級
微軟宣布,已將 OpenAI 迄今為止最具突破性的的 AI 技術(shù)系統(tǒng) GPT-5 全面集成至其產(chǎn)品生態(tài)中,全面增強平臺的的推理、代碼生成與對話體驗。最新版 GPT-5 已在 Micro
阿里通義千問發(fā)布小尺寸模型Qwen3-4B,手機也能跑
電子發(fā)燒友網(wǎng)綜合報道 8月7日,阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新
SuperX全新發(fā)布多種規(guī)格的多模型一體機:全新定義企業(yè)級智能生產(chǎn)力
該一體機將預(yù)搭載OpenAI最新發(fā)布的GPT-OSS-120B 和 GPT-OSS-20B性能卓越的大語言模型(LLM),也可選擇下載全球其
日本航空攜手微軟率先將AI應(yīng)用引入客艙管理
日本航空(JAL)攜手微軟,率先將AI應(yīng)用引I入客艙管理。通過基于微軟Phi-4小型語言模型(SLM)開發(fā)的JAL-
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時,用戶體驗更貼心。
聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣AI人聲萃
發(fā)表于 04-13 19:52
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
[]()
2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步
發(fā)表于 03-19 17:54
微軟發(fā)布phi-3AI模型,性能超越GPT-3.5
評論