可靈AI在北京舉行“靈感成真”2.0模型發(fā)布會(huì),會(huì)上正式發(fā)布全新可靈2.0視頻生成模型與可圖2.0圖像生成模型。據(jù)介紹,可靈2.0在動(dòng)態(tài)質(zhì)量、語(yǔ)義響應(yīng)及畫(huà)面美學(xué)等多個(gè)維度繼續(xù)保持行業(yè)領(lǐng)先地位;而可圖2.0則在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格展現(xiàn)等方面實(shí)現(xiàn)顯著提升。
值得一提的是,早在3月27日,全球AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis便已發(fā)布最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質(zhì)模式)憑借卓越性能,成功登頂圖生視頻(Image to Video)賽道。
在本次2.0模型的迭代中,可靈AI正式發(fā)布AI視頻生成的全新交互理念——Multi-modal Visual Language(MVL)。該理念使用戶(hù)能夠結(jié)合圖像參考、視頻片段等多模態(tài)信息,將腦海中包含身份、外觀(guān)、風(fēng)格、場(chǎng)景等在內(nèi)的多維度復(fù)雜創(chuàng)意,直接且高效地傳達(dá)給AI。
基于MVL理念,可靈AI推出多模態(tài)編輯功能,該功能不僅局限于圖片和視頻,還可以引入聲音、運(yùn)動(dòng)軌跡等其他模態(tài)的信息,使用戶(hù)實(shí)現(xiàn)更為豐富的表達(dá)。為此,快手副總裁、可靈AI負(fù)責(zé)人張迪發(fā)布全新的可靈2.0大師版。這一版本全面升級(jí)視頻及圖像創(chuàng)作可控生成與編輯能力,并上線(xiàn)全新的多模態(tài)視頻編輯功能。
此外,可圖2.0的文生圖能力也迎來(lái)全面升級(jí),包括大幅提升指令遵循能力、顯著增強(qiáng)電影美學(xué)表現(xiàn)力以及提供更多元的藝術(shù)風(fēng)格等,為用戶(hù)帶來(lái)更加出色的創(chuàng)作體驗(yàn)。