用戶(hù)名: 密碼: 驗(yàn)證碼:

字節(jié)跳動(dòng)發(fā)布兩款視頻生成大模型 面向企業(yè)市場(chǎng)開(kāi)啟邀測(cè)

摘要:字節(jié)跳動(dòng)火山引擎發(fā)布豆包視頻生成模型,采用DiT架構(gòu)和擴(kuò)散模型訓(xùn)練,具備多鏡頭語(yǔ)言能力,正在內(nèi)測(cè),未來(lái)將開(kāi)放給用戶(hù)。

  ICC訊 9月24日,字節(jié)跳動(dòng)旗下火山引擎發(fā)布兩款視頻生成大模型(豆包視頻生成-PixelDance、豆包視頻生成-Seaweed),首次面向企業(yè)市場(chǎng)開(kāi)啟邀測(cè)。

  火山引擎介紹,豆包視頻生成模型基于DiT架構(gòu),通過(guò)高效的DiT融合計(jì)算單元,能更充分地壓縮編碼視頻與文本,讓視頻在大動(dòng)態(tài)與運(yùn)鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語(yǔ)言能力。

  此外,豆包視頻生成模型另外一大技術(shù)創(chuàng)新是全新設(shè)計(jì)的擴(kuò)散模型訓(xùn)練方法攻克了多鏡頭切換的一致性難題。該模型還使用深度優(yōu)化的Transformer結(jié)構(gòu),大幅提升視頻生成的泛化能力。

  字節(jié)跳動(dòng)透露,目前,新款豆包視頻生成模型正在即夢(mèng)AI內(nèi)測(cè)版小范圍測(cè)試,未來(lái)將逐步開(kāi)放給所有用戶(hù)。

內(nèi)容來(lái)自:愛(ài)集微
本文地址:http://3xchallenge.com//Site/CN/News/2024/09/25/20240925013401469879.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:字節(jié)跳動(dòng)發(fā)布兩款視頻生成大模型 面向企業(yè)市場(chǎng)開(kāi)啟邀測(cè)
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right