電子發燒友網綜合報道 8月7日,阿里通義千問宣布發布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。目前新模型已在魔搭社區、HuggingFace正式開源。在非推理領域,Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano。在推理領域,Qwen3-4B-Thinking-2507甚至可以媲美中等規模的Qwen3-30B-A3B(thinking)。官方表示,2507版本的Qwen3-4B模型對手機等端側硬件部署尤為友好。

隨著AI技術的廣泛應用,不同場景對模型的需求呈現出多樣化態勢。在一些資源受限的邊緣設備,如智能手機、智能手表、物聯網終端等,大尺寸模型由于計算資源需求大、內存占用高,難以有效部署和運行。同時,對于一些對實時性要求極高的應用場景,如自動駕駛的實時決策、工業生產中的即時質量控制等,大模型的高延遲也成為制約其應用的瓶頸。在此背景下,小尺寸、低延遲且具備一定性能的模型成為市場的新需求。阿里通義千問敏銳地捕捉到這一趨勢,適時推出了Qwen3-4B模型。
Qwen3-4B,從名稱便可知其規模相對較小,“4B”代表著該模型擁有約40億的參數。相較于那些擁有千億甚至萬億參數的“巨無霸”模型,Qwen3-4B堪稱“小個子”。
在語言理解方面,Qwen3-4B展現出了出色的表現。它能夠精準理解人類輸入的各種復雜語句,無論是日常交流中的口語化表達,還是專業領域的術語和復雜邏輯語句,都能快速把握其中的語義和意圖。例如,在醫療領域,面對醫生輸入的包含專業醫學詞匯和復雜診斷邏輯的語句,Qwen3-4B可以準確理解病情信息,為后續的輔助診斷提供可靠依據。在法律場景中,對于法律條文的解讀和法律案例的分析,它也能深入理解其中的法律關系和關鍵要點。
其文本生成能力同樣可圈可點。Qwen3-4B可以生成高質量、連貫且符合語境的文本內容。無論是撰寫新聞稿、故事創作、詩歌生成,還是進行商業文案的策劃,它都能根據給定的主題和要求,快速生成富有創意和邏輯性的文本。而且,生成的文本在語法準確性和語義合理性上都有較高水準,大大減少了人工后期修改的工作量。
在多模態交互方面,Qwen3-4B也有積極探索。它不僅能夠處理文本信息,還能與圖像、音頻等多種模態數據進行交互。例如,在圖像描述生成任務中,它可以根據輸入的圖像,生成準確、生動的文字描述,詳細闡述圖像中的場景、人物、物體及其相互關系。在語音交互場景中,它能夠理解語音輸入的內容,并給出相應的語音或文本回復,實現自然流暢的人機對話。
值得一提的是,Qwen3-4B還具備良好的可擴展性和適應性。開發人員可以根據具體的應用需求,對其進行微調和優化,使其更好地適配不同的業務場景。同時,由于其小尺寸的特點,它在部署和運行過程中對硬件資源的要求較低,能夠在各種資源有限的設備上穩定運行,大大降低了應用成本。
-
阿里
+關注
關注
6文章
465瀏覽量
34193 -
通義千問
+關注
關注
1文章
41瀏覽量
599
發布評論請先 登錄
廣和通加速通義千問Qwen3在端側全面落地
后摩智能NPU適配通義千問Qwen3系列模型
阿里最新消息:國家超算互聯網平臺、廣州算力中心、多所高校接入通義千問大模型
利用英特爾OpenVINO在本地運行Qwen2.5-VL系列模型
阿里通義千問發布小尺寸模型Qwen3-4B,手機也能跑
評論