界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
在百度AI DAY科技開放日上,百度移動生態(tài)商業(yè)研發(fā)團隊正式發(fā)布自研視頻生成模型MuseSteamer,及視頻產(chǎn)品平臺“繪想”。MuseSteamer采用DIT架構(gòu),參數(shù)和業(yè)界最大的視頻生成模型在同一個量級,支持生成連續(xù)10s動態(tài)視頻,最高可生成分辨率為1080P的高清視頻。
百度自研的視頻生成模型還是來了,但并不是來自研發(fā)文心大模型的技術(shù)中臺部門TPG。
去年10月,百度CEO李彥宏曾在內(nèi)部講話中稱百度不會做視頻生成模型,因為Sora這種視頻生成模型的投入周期太長。
在媒體溝通會上,百度副總裁、移動生態(tài)商業(yè)體系負責(zé)人陳一凡在一開場就向界面新聞等媒體解釋了為何百度要做視頻生成模型的問題。他表示,為了幫助代理商和廣告主快速地生成廣告,去年百度移動生態(tài)商業(yè)體系推出了擎舵平臺。但有代理商和廣告主反饋說,一些偏科幻的場景很難拍攝,希望能通過大模型生成。移動生態(tài)商業(yè)體系調(diào)研之后,決定自研視頻生成模型。
一位百度內(nèi)部人士也向界面新聞解釋稱,去年李彥宏在內(nèi)部講話中還提到,基于多模態(tài)的需求,可以做一些相對特定的視頻生成場景。百度前段時間發(fā)布的羅永浩數(shù)字人以及此次發(fā)布的視頻生成模型都是基于特定場景和特定需求的,這是百度內(nèi)部一直在探索的。
目前,市場上大多數(shù)視頻生成模型都是技術(shù)驅(qū)動型,即通過不斷優(yōu)化算法、增加算力、豐富數(shù)據(jù)等技術(shù)手段,提升模型性能和生成視頻的質(zhì)量,以滿足用戶需求和市場競爭,但模型并沒有確定性的應(yīng)用場景,而是隨著模型能力的提升進行持續(xù)探索。相比之下,百度視頻生成模型最大的不同就是商業(yè)驅(qū)動,即先有了明確的商業(yè)需求,再結(jié)合需求研發(fā)模型。
百度商業(yè)體系商業(yè)研發(fā)總經(jīng)理劉林向界面新聞透露,MuseSteamer項目在今年春節(jié)之后才開始立項,研發(fā)團隊有幾十個人,到上線有效的研發(fā)時間只有3個月。
劉林表示,MuseSteamer之所以能夠在較短時間上線,是因為其在技術(shù)上并不是完全從零起步。擎舵平臺在多模態(tài)生成上本身就有了一定的技術(shù)積累,百度商業(yè)體系在模型訓(xùn)練框架推理、卡片調(diào)優(yōu)上也有一些積累,能夠快速的延續(xù)過來。
目前,MuseSteamer模型Turbo版已上線“繪想”平臺,開啟限時免費公測,其余版本將于8月陸續(xù)開放。陳一凡表示,“繪想”平臺的定位是一個營銷產(chǎn)品,目標是服務(wù)好B端的廣告主。
根據(jù)百度官方公布的數(shù)據(jù),目前,“繪想”平臺已生成超過100個AIGC廣告在百度商業(yè)體系內(nèi)上線投放。
至于MuseSteamer模型是否會服務(wù)C端用戶,陳一凡并沒有給出明確答案。但目前,全新改版的百度搜索已接入MuseSteamer模型,后續(xù)百度很可能將其接入更多C端產(chǎn)品來面向普通用戶提供服務(wù)。
“C端的想象空間是非常大的,前提是我們把模型做好。”陳一凡表示。
還沒有評論,來說兩句吧...