近期,科技界迎來了一波人工智能領域的重大進展。特斯拉創始人埃隆·馬斯克宣布,其旗下的人工智能實驗室xAI即將推出Grok 3.5版本,這一版本的人工智能據稱能夠準確解答關于火箭發動機和電化學技術的專業問題,并且能夠從第一原理出發進行推理,生成互聯網上未曾存在的答案。
xAI實驗室將Grok 3.5定位為全球首個能從第一性原理出發進行推理,并生成獨特答案的人工智能系統。這一消息發布后,引起了業界的廣泛關注。此前,xAI已經在今年2月推出了Grok 3版本,并在發布后的兩天內,將該應用免費向公眾開放。這一舉措迅速提升了Grok 3的知名度,使其超越了ChatGPT,登上了蘋果應用商店免費應用下載排行榜的首位。馬斯克甚至曾稱贊Grok 3為“地球上最聰明的人工智能”。
然而,就在馬斯克宣布即將推出Grok 3.5的前夕,中國科技巨頭阿里巴巴也發布了其新一代通義千問模型——Qwen3。這一發布時機不禁讓人將兩者聯系起來。Qwen3在參數量上僅為DeepSeek-R1的三分之一,成本大幅降低,但性能卻全面超越了R1、OpenAI-o1等全球頂尖模型,成功登頂全球最強開源模型的寶座。
Qwen3作為國內首個“混合推理模型”,集成了“快思考”與“慢思考”兩種模式,能夠針對簡單需求以低算力迅速給出答案,而對于復雜問題,則能夠進行多步驟的“深度思考”。這一設計大大節省了算力消耗,提高了模型的效率。
在多個權威評測中,Qwen3展現出了其卓越的性能。在奧數水平的AIME25測評中,Qwen3獲得了81.5分的高分,刷新了開源模型的紀錄。在考察代碼能力的LiveCodeBench評測中,Qwen3突破了70分大關,表現甚至優于Grok3。在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分的成績超越了OpenAI-o1及DeepSeek-R1。
Qwen3在性能大幅提升的同時,部署成本也大幅下降。僅需4張H20顯卡即可部署Qwen3的滿血版,顯存占用僅為性能相近模型的三分之一。這一優勢使得Qwen3在實際應用中具有更強的競爭力。
隨著Grok 3.5和Qwen3的相繼發布,人工智能領域的競爭愈發激烈。這些創新不僅推動了技術的進步,也為未來的應用提供了更多的可能性。