欧美性开放视频,国产av亚洲精品ai换脸电影 ,牲欲强的熟妇农村老妇女

首頁 > AI資訊 > 最新資訊 > 這個模型腦補(bǔ)能力比GAN更強(qiáng)，ETH提出新型超分辨率模型SRFlow

這個模型腦補(bǔ)能力比GAN更強(qiáng)，ETH提出新型超分辨率模型SRFlow

新火種 2023-09-13

編輯：小舟、魔王近日，來自蘇黎世聯(lián)邦理工學(xué)院計算機(jī)視覺實驗室的研究者提出了一種超分辨率模型 SRFlow。該模型具備比 GAN 更強(qiáng)的腦補(bǔ)能力，能夠根據(jù)低分辨率輸入學(xué)習(xí)輸出的條件分布。該論文已被 ECCV 2020 收錄。超分辨率是一個不適定問題（ill-posed problem），它允許對給定的低分辨率圖像做出多種預(yù)測。這一基礎(chǔ)事實很大程度上被很多當(dāng)前最優(yōu)的深度學(xué)習(xí)方法所忽略，這些方法將重建和對抗損失結(jié)合起來，訓(xùn)練確定性映射（deterministic mapping）。近日，來自蘇黎世聯(lián)邦理工學(xué)院計算機(jī)視覺實驗室的研究者提出了一種新的超分辨率模型 SRFlow。該模型是一種基于歸一化流的超分辨率方法，具備比 GAN 更強(qiáng)的腦補(bǔ)能力，能夠基于低分辨率輸入學(xué)習(xí)輸出的條件分布。

論文地址：/uploads/pic/20230913/SRFlow.pdf log-likelihood）對模型進(jìn)行訓(xùn)練。SRFlow 直接解釋了超分辨率問題的不適定性，并學(xué)習(xí)預(yù)測不同逼真度的高分辨率圖像。此外，研究者利用 SRFlow 學(xué)到的強(qiáng)大圖像后驗來設(shè)計靈活的圖像處理技術(shù)，能夠通過傳輸其他圖像的內(nèi)容來增強(qiáng)超分辨率圖像。該研究展示了基于人臉圖像以及其他超分辨率圖像實驗，結(jié)果表明 SRFlow 在 PSNR 和感知質(zhì)量度量上都優(yōu)于當(dāng)前最優(yōu)的 GAN 方法，同時 SRFlow 允許探索超分辨率解空間，以實現(xiàn)生成圖像的多樣性。下圖展示了基于 GAN 的 ProgFSR 與基于歸一化流的 SRFlow 的對比結(jié)果：

SRFlow 方法簡介研究者將超分辨率公式化為：給定低分辨率（LR）輸入圖像，學(xué)習(xí)高分辨率（HR）圖像的條件概率分布問題。該方法旨在通過捕獲基于自然圖像流形的所有可能超分辨率（SR）圖像，來明確地解決超分辨率問題的不適定性。為此，研究者設(shè)計了條件歸一化流架構(gòu)，使用基于對數(shù)似然的訓(xùn)練來學(xué)習(xí)豐富的分布。用于超分辨率的條件歸一化流超分辨率的目標(biāo)是通過生成缺失的高頻細(xì)節(jié)，來預(yù)測給定低分辨率圖像 x 的更高分辨率版本 y。大多數(shù)當(dāng)前方法學(xué)習(xí)確定性映射 x→y，而該研究旨在獲取與 LR 圖像 x 對應(yīng)的自然 HR 圖像 y 的全條件分布。這是一個頗具挑戰(zhàn)性的問題，因為該模型必須捕獲多種可能的 HR 圖像，而不僅僅是預(yù)測單個 SR 輸出。該研究的目的是在給定大量 LR-HR 訓(xùn)練對的情況下，以純數(shù)據(jù)驅(qū)動的方式訓(xùn)練分布的參數(shù) θ。條件流層流層（flow-layer）f^n_θ 的設(shè)計需格外精細(xì)，以確保 well-conditioned inverse 和易于處理的雅可比行列式。[10,11] 首次解決了該挑戰(zhàn)，最近也有很多研究者對此感興趣 [5,14,21]。該研究從無條件 Glow 架構(gòu) [21] 開始，該架構(gòu)本身基于 RealNVP [11]。這些架構(gòu)使用的流層可以以直接的方式設(shè)置為有條件的 [3,49]。研究者對其進(jìn)行了概述，并介紹了該研究提出的 Affine Injector 層。架構(gòu)SRFlow 的架構(gòu)如圖 2 所示：

應(yīng)用和圖像處理研究者將 SRFlow 網(wǎng)絡(luò)用于多項應(yīng)用和圖像處理任務(wù)，該研究的技術(shù)利用了 SRFlow 網(wǎng)絡(luò)的兩個關(guān)鍵優(yōu)勢，而這是基于 GAN 的超分辨率的方法 [47] 所不具備的。首先，該研究的網(wǎng)絡(luò)對 HR 圖像空間內(nèi)的分布建模，而不僅僅是預(yù)測單個圖像。因此，它通過捕獲多個可能的 HR 預(yù)測而具有極大的靈活性。這就允許使用其它指導(dǎo)信息或隨機(jī)采樣來探索不同的預(yù)測。其次，該流網(wǎng)絡(luò) f_θ(y; x) 是完全可逆的編碼器 - 解碼器。因此，任何 HR 圖像都可以被編碼成到潛在空間（latent space）中，并精確地重構(gòu)為。這種雙射的對應(yīng)關(guān)系允許在潛在空間和圖像空間中靈活操作。隨機(jī)超分辨率給定 LR 圖像 x，我們可以通過采樣不同的 SR 預(yù)測，探索 SRFlow 學(xué)習(xí)到的分布。正如基于流的模型的觀察結(jié)果那樣，方差較小的采樣可以實現(xiàn)最佳結(jié)果 [21]。因此，研究者使用具有方差 τ（也稱為溫度）的高斯分布。當(dāng) τ = 0.8 時，結(jié)果如下圖 3 所示：

LR 一致性風(fēng)格遷移對 LR 圖像 x 進(jìn)行超分辨處理時，SRFlow 允許遷移現(xiàn)有 HR 圖像的風(fēng)格。下圖 4 展示了圖像中面部特征、發(fā)色和眼睛顏色的風(fēng)格遷移：

潛在空間歸一化研究者利用 SRFlow 網(wǎng)絡(luò) f_θ 的可逆性和學(xué)得的超分辨率后驗，開發(fā)了更先進(jìn)的圖像處理技術(shù)。該方法的核心思想是將包含所需內(nèi)容的任意 HR 圖像映射到潛在空間，在該空間中對潛在統(tǒng)計量（latent statistics）進(jìn)行歸一化，使其與給定 LR 圖像中的低頻信息一致。令 x 為低分辨率圖像，為任意高分辨率圖像（不一定與 LR 圖像 x 一致）。該研究的目標(biāo)是獲得 HR 圖像 y，其包含的圖像內(nèi)容，并與 LR 圖像 x 一致。圖像內(nèi)容遷移該研究旨在通過傳輸其他圖像的內(nèi)容來操縱 HR 圖像。令 x 為 LR 圖像，y 為對應(yīng)的 HR 圖像。如要處理超分辨率圖像，則是 x 的 SR 樣本。但，我們也可以通過將 x 設(shè)置為 y 的 down-scaled 版本，來操縱現(xiàn)有的 HR 圖像 y。研究人員將其他圖像的內(nèi)容直接嵌入 y 的圖像空間，進(jìn)而操縱 y，如下圖 5 所示：

圖像恢復(fù)研究者將學(xué)得的圖像后驗應(yīng)用于圖像恢復(fù)任務(wù)，進(jìn)而其能力。注意，此處研究者采用了相同的 SRFlow 網(wǎng)絡(luò)，該網(wǎng)絡(luò)僅針對超分辨率進(jìn)行訓(xùn)練。研究者探索了對圖像中的高頻信息產(chǎn)生主要影響的因素，如噪聲和壓縮偽影。

實驗研究者將其提出的方法與當(dāng)前 SOTA 方法進(jìn)行了對比，并執(zhí)行了控制變量分析。人臉超分辨率該研究基于 CelebA 測試集中的 5000 張圖像，評估了 SRFlow 在人臉超分辨率圖像任務(wù)中的性能，并與 bicubic、RRDB [47]、ESRGAN [47] 和 ProgFSR [19] 進(jìn)行了對比。

通用超分辨率研究者在 DIV2K 驗證集上評估了 SRFlow 在通用超分辨率任務(wù)中的性能，并與 Bicubic、EDSR 、RRDB、ESRGAN 和 RankSRGAN 進(jìn)行了對比。

與基于 GAN 的方法 [47,56] 相比，SRFlow 實現(xiàn)了明顯更好的 PSNR、LPIPS 和 LR-PSNR 結(jié)果，并在 PIQUE 和 BRISQUE 方面也得到了出色的結(jié)果。圖 8 中的可視化結(jié)果表明，EDSR 和 RRDB 的感知效果較差，這些結(jié)果幾乎不會產(chǎn)生高頻細(xì)節(jié)。相比之下，與 ESRGAN 相比，SRFlow 能夠生成豐富的細(xì)節(jié)，實現(xiàn)了良好的感知效果。如第一行所示，ESRGAN 生成的圖像在多個位置存在嚴(yán)重的褪色偽影（discolored artifact）和振鈴效應(yīng)（ringing pattern）。而 SRFlow 能夠生成更加穩(wěn)定和一致的結(jié)果。

控制變量研究此外，為了研究深度和寬度這兩個因素的影響，研究者進(jìn)行了控制變量實驗。圖 9 顯示了在 CelebA 數(shù)據(jù)集上的結(jié)果：

如何根據(jù)任務(wù)需求搭配恰當(dāng)類型的數(shù)據(jù)庫？在AWS推出的白皮書《進(jìn)入專用數(shù)據(jù)庫時代》中，介紹了8種數(shù)據(jù)庫類型：關(guān)系、鍵值、文檔、內(nèi)存中、關(guān)系圖、時間序列、分類賬、領(lǐng)域?qū)捔校⒅鹨环治隽嗣糠N類型的優(yōu)勢、挑戰(zhàn)與主要使用案例。

Tags:

GAN 模型分辨率

相關(guān)推薦

免責(zé)聲明: 本文所包含的觀點僅代表作者個人看法，不代表新火種的觀點。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認(rèn)可。交易和投資涉及高風(fēng)險，讀者在采取與本文內(nèi)容相關(guān)的任何行動之前，請務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

這個模型腦補(bǔ)能力比GAN更強(qiáng)，ETH提出新型超分辨率模型SRFlow

華知大模型5.0發(fā)布

三個大模型組隊挑戰(zhàn)o1，實測360多模型協(xié)作干掉提示詞工程

浩鯨科技鯨智BI大模型發(fā)布，從算法炫技到價值落地

騰訊元器推出智能體新應(yīng)用，支持公眾號主打造專屬大模型數(shù)字分身

大模型賦能智能座艙！NVIDIA深度適配通義千問大模型

熱門文章