FramePack 降低 AI 視頻生成硬件門檻,6GB 顯存即可生成 60 秒視頻
2025-04-20 09:36:51 小編:鑫昌軟件園
本站 4 月 20 日消息,來自 GitHub 的 Lvmin Zhang 與斯坦福大學(xué)的 Maneesh Agrawala 合作,共同推出了一項(xiàng)名為 FramePack 的創(chuàng)新技術(shù)。該技術(shù)通過采用固定長度的時(shí)域上下文(fixed-length temporal context)對(duì)視頻擴(kuò)散模型(video diffusion)進(jìn)行了實(shí)用化實(shí)現(xiàn),顯著提高了處理效率,使得在較低硬件配置下生成更長、更高質(zhì)量的 AI 視頻成為可能?;?FramePack 架構(gòu)構(gòu)建的一個(gè) 130 億參數(shù)模型,僅需 6GB 顯存即可生成長達(dá) 60 秒的視頻片段。
據(jù)本站了解,F(xiàn)ramePack 是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),其核心優(yōu)勢(shì)在于利用多階段優(yōu)化技術(shù),有效降低了本地運(yùn)行 AI 視頻生成任務(wù)對(duì)硬件的要求。據(jù)報(bào)道,目前 FramePack 的圖形用戶界面(GUI)內(nèi)部運(yùn)行的是一個(gè)定制的、基于混元(Hunyuan)的模型,但研究論文同時(shí)指出,現(xiàn)有的預(yù)訓(xùn)練模型也可以通過 FramePack 技術(shù)進(jìn)行微調(diào)以適配該架構(gòu)。
傳統(tǒng)的視頻擴(kuò)散模型在生成視頻時(shí),通常需要處理先前生成的所有帶噪幀(noisy frames)數(shù)據(jù)來預(yù)測(cè)下一個(gè)噪聲更少的幀。這個(gè)過程中所參考的輸入幀數(shù)量被稱為“時(shí)域上下文長度”,它會(huì)隨著視頻長度的增加而增長。這導(dǎo)致標(biāo)準(zhǔn)的視頻擴(kuò)散模型對(duì)顯存(VRAM)有著極高的要求,通常需要 12GB 甚至更多。雖然可以通過降低視頻長度、犧牲畫面質(zhì)量或延長處理時(shí)間來減少顯存消耗,但這并非理想解決方案。
為此,F(xiàn)ramePack 應(yīng)運(yùn)而生。該新架構(gòu)能根據(jù)幀的重要性對(duì)其進(jìn)行壓縮,并匯集到一個(gè)固定大小的上下文長度內(nèi),從而極大地降低了 GPU 的顯存開銷。所有輸入幀都經(jīng)過壓縮處理,以確保滿足預(yù)設(shè)的上下文長度上限。研究者表示,經(jīng)過優(yōu)化后,F(xiàn)ramePack 的計(jì)算成本與圖像擴(kuò)散模型的成本相近。
此外,F(xiàn)ramePack 還結(jié)合了緩解“漂移”(drifting)現(xiàn)象的技術(shù) —— 即視頻質(zhì)量隨長度增加而下降的問題,從而在不顯著犧牲保真度的情況下,支持生成更長的視頻內(nèi)容。
在硬件兼容性方面,目前 FramePack 明確要求使用支持 FP16 和 BF16 數(shù)據(jù)格式的英偉達(dá) RTX 30、40 或 50 系列 GPU。對(duì)于圖靈(Turing)架構(gòu)及更早的英偉達(dá)顯卡,以及 AMD 和 Intel 的硬件支持情況,目前尚未得到驗(yàn)證。操作系統(tǒng)方面,Linux 已確認(rèn)在支持列表之中??紤]到 6GB 顯存的需求,除了 RTX 3050 4GB 等少數(shù)型號(hào)外,市面上大多數(shù)現(xiàn)代 RTX 顯卡都能滿足運(yùn)行要求。
性能方面,以 RTX 4090 為例,在啟用 teacache 優(yōu)化后,生成速度可達(dá)約每秒 0.6 幀。實(shí)際速度會(huì)因用戶顯卡型號(hào)的不同而有所差異。值得一提的是,F(xiàn)ramePack 在生成過程中會(huì)逐幀顯示畫面,提供即時(shí)的視覺反饋。
目前,F(xiàn)ramePack 所使用的模型可能有 30 幀 / 秒的上限,這或許會(huì)限制部分用戶的需求,但 FramePack 的出現(xiàn)無疑為普通消費(fèi)者進(jìn)行 AI 視頻創(chuàng)作鋪平了道路,提供了一種替代昂貴第三方云服務(wù)的可行方案。即使對(duì)于非專業(yè)內(nèi)容創(chuàng)作者,這項(xiàng)技術(shù)也為制作 GIF 動(dòng)圖、表情包等娛樂內(nèi)容提供了有趣的工具。
- 猜你喜歡
-
咸魚喵喵手機(jī)版553.39MB手游下載
-
群星紀(jì)元最新版本1.22GB手游下載
-
宇智波斑破碎現(xiàn)實(shí)官方版下載530.04MB手游下載
-
COD19自制版最新版本2.05GB手游下載
-
三國真龍傳最新版292.07MB手游下載
-
幻日夜羽蜃景努瑪梓手游763.54MB手游下載
-
養(yǎng)只寵物球手機(jī)版493.77KB手游下載
-
魔女之家手機(jī)漢化版219.7MB手游下載
-
神椿市協(xié)奏中官方正版1.60GB手游下載
- 相關(guān)手機(jī)游戲
-
紅色境地模組版533.45MB手游下載
-
Granny重新想象手機(jī)版699.4MB手游下載
-
寂靜之夜游戲最新版246.73MB手游下載
-
卡車大師世界模擬器官方版未知手游下載
-
猶格索托斯的庭院手機(jī)版563.81MB手游下載
-
假面騎士Evol驅(qū)動(dòng)器模擬器41.90MB手游下載
-
凱蒂貓和好朋友們官方版102.89MB手游下載
-
阿西美女室友竟然游戲手機(jī)版185.17MB手游下載
-
植物大戰(zhàn)僵尸我的世界版手機(jī)版144.2MB手游下載
- 推薦鑫昌秘籍
- FramePack 降低 AI 視頻生成硬件門檻,6GB 顯存即可生成 60 秒視頻
- Android 16 允許 Linux 終端使用手機(jī)全部存儲(chǔ)空間
- 消息稱特斯拉美國“平價(jià)版”Model Y 量產(chǎn)推遲,已調(diào)整至明年年初
- 微軟發(fā)布 Win11 RP 26100.3909 更新:擱置分享修圖功能,定制鎖屏天氣小部件
- 機(jī)械革命 1kg 輕薄本曝光,預(yù)計(jì)“很快”發(fā)布
- 三星 Galaxy Tab S10 FE 系列平板國行版 4 月 21 日開售:Exynos 1580 芯片,國補(bǔ)價(jià) 2999 元起
- ColorOS 支持微信朋友圈 Live 圖,OPPO / 一加 70+ 款機(jī)型陸續(xù)升級(jí)覆蓋
- 索尼 SIE 前高管:現(xiàn)代游戲流程太冗長,對(duì)玩家吸引力越來越小
- ChatGPT 低調(diào)上線“記憶搜索”功能:個(gè)性化搜索結(jié)果更精準(zhǔn)
- 我國輕舟貨運(yùn)飛船 4 月 24 日首次向公眾亮相
- 最新手機(jī)精選
-
櫻桃視頻直播官方版下載2025-01-28手游下載 | 88.51MB
-
TFS飛行模擬器破解版2025-02-14手游下載 | 86.66MB
-
Poppy Playtime第五章正版2025-01-15手游下載 | 603MB
-
花心直播軟件在哪里下載安卓版最新版2025-03-15手游下載 | 85.77MB
-
月夜直播免費(fèi)版下載觀看下載官方版2025-02-09手游下載 | 55.74MB
-
挺好tvbox電視版2025-02-13手游下載 | 39.09MB