近日,阿里巴巴在AI技術(shù)領(lǐng)域邁出了重要一步,正式對(duì)外開(kāi)源了其先進(jìn)的視頻生成與編輯模型——通義萬(wàn)相Wan2.1-VACE。這款模型不僅功能強(qiáng)大,而且兼容性廣泛,能夠一次性涵蓋從文字到視頻的生成、圖像參考視頻制作、視頻重繪、局部編輯、背景延展及時(shí)長(zhǎng)延展等一系列基礎(chǔ)操作。
據(jù)《科創(chuàng)板日?qǐng)?bào)》的相關(guān)報(bào)道,通義萬(wàn)相Wan2.1-VACE此番開(kāi)源提供了兩個(gè)版本,分別是1.3B和14B。尤為較輕量級(jí)的1.3B版本對(duì)硬件要求相對(duì)較低,即便是普通消費(fèi)級(jí)顯卡也能流暢運(yùn)行,這無(wú)疑大大降低了用戶的使用門(mén)檻。
通義萬(wàn)相作為阿里云通義系列中的一員,自2023年7月7日上線以來(lái),便以其在AI繪畫(huà)創(chuàng)作領(lǐng)域的卓越表現(xiàn)贏得了廣泛關(guān)注。而在2024年9月的阿里云棲大會(huì)上,阿里更是推出了通義萬(wàn)相的視頻生成大模型,該模型不僅能夠生成高質(zhì)量的影視級(jí)視頻,還特別擅長(zhǎng)理解和處理中文指令,進(jìn)一步提升了其實(shí)用價(jià)值。
回顧通義萬(wàn)相的發(fā)展歷程,其視頻生成模型在短短數(shù)月內(nèi)便實(shí)現(xiàn)了從初步版本到2.1版的飛躍。今年1月,通義萬(wàn)相宣布模型升級(jí)至2.1版,此次升級(jí)在多個(gè)關(guān)鍵領(lǐng)域取得了顯著突破,包括復(fù)雜運(yùn)動(dòng)處理、真實(shí)物理規(guī)律還原、電影質(zhì)感提升以及指令遵循優(yōu)化等。這些改進(jìn)使得模型在生成高質(zhì)量視頻方面更加得心應(yīng)手。
而在2月25日,阿里巴巴更是做出了一個(gè)大膽的決定,全面開(kāi)源旗下的通義萬(wàn)相2.1視頻生成模型。這一舉措不僅彰顯了阿里巴巴在AI技術(shù)領(lǐng)域的開(kāi)放態(tài)度,更為全球開(kāi)發(fā)者提供了一個(gè)學(xué)習(xí)和探索先進(jìn)視頻生成技術(shù)的寶貴平臺(tái)。