在科技巨頭紛紛推出最新大語言模型的4月,阿里巴巴于4月29日凌晨正式揭曉了其壓軸之作——Qwen3系列。這款大模型的問世,不僅標志著阿里巴巴在AI領域的又一次重大突破,還為其在全球開發者社區中贏得了廣泛關注。
本月早些時候,meta、字節跳動、OpenAI、Google及百度等科技巨頭已相繼推出了各自的大模型產品。其中,OpenAI更是一口氣推出了三款,而百度在Create 2025 AI開發者大會上亦發布了兩款新品。面對如此激烈的競爭環境,阿里巴巴的Qwen3系列能否帶來新意,成為了業界關注的焦點。
事實證明,Qwen3系列確實不負眾望。作為阿里巴巴旗艦級的大模型產品,它不僅延續了開源路線,還在模型性能上取得了顯著提升,進一步縮小了與頂尖大模型之間的差距。更令人矚目的是,Qwen3系列還是一款混合推理模型,支持思考模式和非思考模式,這一創新設計使其在眾多大模型中脫穎而出。
混合推理模型的概念并非首次提出,但Qwen3系列卻是國內首個真正落地并完全開源的混合推理模型。在全球范圍內,除Claude-3.7-Sonnet和Google近期推出的Gemini 2.5 Flash外,鮮有類似嘗試。OpenAI雖然也表明了“混合推理”的目標,但仍在開發中。Qwen3系列的這一創新設計,無疑為其贏得了更多關注。
Qwen3系列還是一個多尺寸的系列模型,涵蓋了從0.6B到32B的六個稠密模型,以及適用于復雜任務的MoE混合專家模型Qwen3-30B-A3B和Qwen3-235B-A22B。這些模型全部支持119種語言和方言,為用戶和開發者提供了更多選擇。
在性能表現上,Qwen3系列同樣不負眾望。阿里巴巴宣稱,小模型如Qwen3-4B的性能已可媲美上一代的Qwen2.5-72B-Instruct。而MoE模型更是在基準測試上表現出了媲美頂尖閉源模型的能力。尤其是在數學推理基準AIME25上,Qwen3-235B-A22B得分達到81.5,刷新了開源模型的紀錄。
然而,Qwen3系列也并非十全十美。在實際推理表現上,Qwen3-235B-A22B在面對復雜問題時仍顯得力不從心。有時即便在滿血狀態下,也容易陷入冗長而無用的推理中,導致最終結果不理想。這一點在雷科技的測試中得到了體現,Qwen3-235B-A22B在面對某些問題時,思考太久且不斷重復方向,甚至未能抓住關鍵信息。
盡管如此,Qwen3系列的推出仍然為阿里巴巴在AI戰略上帶來了重要補強。過去兩年里,阿里巴巴在大模型領域的布局雖然不算慢,但始終未能真正站到最前排。Qwen3系列的推出,不僅提升了阿里巴巴在開源生態中的存在感,還為其在AI商業化競爭中增強了籌碼。
從商業化的角度來看,Qwen3系列直接回應了當前模型商業應用的兩大痛點:推理成本高以及靈活適配性不足。通過引入MoE架構大幅降低推理成本,同時又在推理機制上支持思考與非思考的靈活切換,Qwen3系列在推理效率與推理成本之間找到了相對平衡的位置。
對于阿里巴巴來說,Qwen3系列的推出不僅是一次技術上的升級,更是一次戰略上的重要布局。它不僅能夠提升阿里巴巴在AI領域的競爭力,還能夠為其在AI商業化方向上帶來新的機遇。隨著大模型競爭的加劇,性能和成本將成為兩條重要主線。阿里巴巴能否繼續保持節奏,甚至在未來占據主動,仍需更多技術演進和產品落地來檢驗。