首頁 > AI資訊 > 最新資訊 > 一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

新火種    2024-01-03

單RTX4090,每秒生成100張圖!

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

一種專為實時交互式圖像生成而設計的一站式解決方案,登頂GitHub熱榜。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

方案名為StreamDiffusion,支持多種模型和輸出幀率。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

無論是圖像到圖像,還是文本到圖像,都能實時生成:

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

重點是,該項目現已開源,在GitHub熱榜已狂攬3400+星。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

經測試,使用SD-turbo模型在去噪步驟為1步的情況下,文本-圖像每秒幀率可達106,圖像-圖像每秒幀率達到93。

CM-LoRA+KohakuV2模型在4步的情況下,文本-圖像每秒幀率為38,圖像-圖像每秒幀率為37。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

除了高吞吐量、低延遲,StreamDiffusion還做到了低功耗。單塊RTX3060上,可降低58.2%的功耗;單塊RTX4090,降低49.8%。

網友們也是玩嗨了,紛紛上手嘗試:

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

淺淺留下一個字:

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

StreamDiffusion長啥樣?

StreamDiffusion由來自UC伯克利、筑波大學等的研究人員聯合提出。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

StreamDiffusion Pipeline包含六大組件:Stream Batch、殘差無分類器指導(RCFG)、輸入/輸出隊列、隨機相似性過濾器、KV-Caches預計算、帶有小型自動編碼器的模型加速工具。

首先Stream Batch,是將原來順序的去噪步驟改為批量化處理。允許在一個批處理中,每幅圖像處于去噪流程的不同階段。

如此一來,可以大大減少UNet推理次數,顯著提高吞吐量。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

此外,原先的CFG算法中,需要額外大量計算負樣本,導致計算效率低下。

RCFG方法則構建一個“虛擬殘差噪聲”,這樣就只需要一次或者零次負樣本計算,減少了計算負樣本的開銷。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

相比之前的CFG方法加速了2倍。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

而輸入/輸出隊列主要是利用隊列存儲緩沖輸入和輸出,將圖像數據預處理等操作與UNet主體網絡分隔開,實現管道各個處理環節的并行化,防止處理速度不匹配的情況發生。

隨機相似性過濾器,可以基于圖像相似性跳過一些UNet處理,減少不必要的計算量,降低功耗:

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

預計算則是提前緩存一些靜態量,如提示嵌入、噪聲樣本等,減少每次生成的重復計算。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

最后,使用TensorRT、Tiny AutoEncoder等加速模塊,對模型進行優化,進一步提升推理速度。

一秒100張實時生成二次元老婆照!高吞吐低延遲低功耗|登頂GitHub熱榜、已開源

在測試階段,研究人員使用SD-turbo、512×512分辨率、批處理大小為1,進行文本到圖像的生成。

結果,使用StreamDiffusion可以在10毫秒內生成一張圖像,也就是一秒100多張圖。

Tags:
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章