阿里巴巴于近日震撼發布其最新一代通義千問大語言模型——Qwen3,此舉標志著中國在開源語言模型領域取得了世界級突破,Qwen3一躍成為全球頂尖的開源模型。
Qwen3的核心競爭力在于其開創性的混合推理架構,這是國內首次將“快速思考”與“深度思考”機制融合于單一模型的創新實踐。該架構不僅賦予Qwen3處理復雜問題時的多步驟深度推理能力,還能迅速響應簡單任務,實現了算力資源的高效利用,完美平衡了性能與效率。
Qwen3具備卓越的多語言處理能力,覆蓋簡體中文、繁體中文、粵語等119種語言和方言,這一特性顯著拓寬了其應用場景,使其能夠更靈活地服務于全球范圍內的用戶,滿足多樣化的語言需求。
為了滿足不同用戶群體的需求,阿里云精心推出了8款規模各異的Qwen3模型,其中包括兩款MoE(專家混合)模型:Qwen3-235B-A22B與Qwen3-30B-A3B,分別擁有2350億和300億總參數,以及220億和30億激活參數。還有六款Dense模型,參數規模從0.6B至32B不等,為用戶提供了豐富的選擇空間。所有這些模型均在Apache 2.0許可協議下開源,用戶可以按需選用。
Qwen3系列模型現已通過GitHub和阿里云ModelScope平臺全面開源,并遵循Apache 2.0許可協議,支持免費商用。特別是旗艦級模型Qwen3-235B-A22B,其部署僅需4張H20顯卡,顯存占用僅為同類模型的三分之一,極大地降低了部署成本和使用難度。
阿里巴巴的這一重大發布,無疑為全球開源社區注入了新的活力,Qwen3憑借其獨特的混合推理架構和強大的多語言處理能力,有望在多個領域掀起技術創新的浪潮。