(資料圖片)

智通財(cái)經(jīng)APP獲悉,國(guó)泰海通發(fā)布研報(bào)稱,近期,字節(jié)旗下的即夢(mèng)團(tuán)隊(duì)發(fā)布Seedance2.0全新視頻生成大模型,真正實(shí)現(xiàn)了從“能生成”到“能商用”的跨越式突破,該模型首次實(shí)現(xiàn)了文字理解與字幕動(dòng)效生成,可自動(dòng)解析參考圖中的文字并添加合理動(dòng)態(tài)效果。此進(jìn)展標(biāo)志著AI正從"單模態(tài)理解"向"全雙工連續(xù)感知"與"跨模態(tài)深度創(chuàng)作"躍遷。Seedance2.0的自主創(chuàng)作能力不僅重塑了內(nèi)容生產(chǎn)與交互模式,更催生了涵蓋視頻生成、實(shí)時(shí)交互、設(shè)計(jì)工具、端側(cè)智能等環(huán)節(jié)的全新產(chǎn)業(yè)鏈投資機(jī)會(huì)。該行看好AI應(yīng)用加速落地的長(zhǎng)期發(fā)展空間。

國(guó)泰海通主要觀點(diǎn)如下:

Seedance2.0發(fā)布,控制精度提升至“導(dǎo)演級(jí)”

其四項(xiàng)巨大突破,使得Seedance2.0的模型能力產(chǎn)生質(zhì)變:1)自分鏡和自運(yùn)鏡,模型可以根據(jù)用戶描述的情節(jié)自動(dòng)規(guī)劃分鏡運(yùn)鏡。2)全方位多模態(tài)參考,用戶可以同時(shí)給它最多9張圖片、3段視頻和3段音頻,總共12個(gè)參考文件。3)音畫同步生成。Seedance 2.0在生成視頻的同時(shí)可以生成匹配的音效和配樂,并且支持口型同步和情緒匹配。4)多鏡頭敘事能力。它可以在多個(gè)鏡頭之間維持角色和場(chǎng)景的一致性。

Seedance2.0生成穩(wěn)定性提升,視頻制作成本有望大幅降低

根據(jù)極客公園測(cè)算,Seedance2.0生成15秒視頻的可用率或達(dá)到90%,相較此前行業(yè)內(nèi)平均值大概20%,提升幅度較大。當(dāng)生成的視頻可用率提升后,可降低實(shí)際成本,以做90分鐘的視頻項(xiàng)目為例,成本有望從1萬(wàn)多降低到2000元左右,將提升行業(yè)的使用量,其巨大的成本壓縮,或可改變整個(gè)行業(yè)的底層邏輯。

Seedance2.0標(biāo)志著AI視頻生成從"技術(shù)可行"向"商業(yè)可用"的關(guān)鍵跨越

過(guò)去一年,視頻生成領(lǐng)域已完成從512像素靜態(tài)圖像到10秒電影級(jí)短片的代際躍升。此次升級(jí)的多鏡頭敘事與角色一致性保障能力,使情節(jié)連貫的微短劇工業(yè)化生產(chǎn)加速落地。傳統(tǒng)動(dòng)畫制作流程中,關(guān)鍵幀繪制、中間畫填充、口型同步等環(huán)節(jié)向來(lái)是產(chǎn)能瓶頸。Seedance2.0通過(guò)AI輔助可顯著壓縮上述工序的工時(shí)成本。實(shí)測(cè)數(shù)據(jù)顯示,其生成內(nèi)容在大范圍運(yùn)動(dòng)穩(wěn)定性、分鏡邏輯性、音畫同步精度等核心指標(biāo)上均已達(dá)到專業(yè)制作標(biāo)準(zhǔn);系統(tǒng)可自主完成"全景-中景-特寫"的景別切換,運(yùn)鏡策略契合專業(yè)導(dǎo)演的敘事邏輯。這種"導(dǎo)演級(jí)"的控制精度意味著AI視頻工具已具備商業(yè)化落地條件。

風(fēng)險(xiǎn)提示:模型升級(jí)不及預(yù)期,市場(chǎng)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn)。