作者丨左育莘

學校丨西安電子科技大學

研究方向丨計算機視覺

影象去噪是low-level視覺問題中的一個經典的話題。其退化模型為 y=x+v，影象去噪的標的就是透過減去噪聲 v，從含噪聲的影象 y 中得到乾凈影象 x 。在很多情況下，因為各種因素的影響，噪聲的資訊是無法得到的，在這樣的情況下進行去噪，就變成了盲去噪。

Image Blind Denoising With Generative Adversarial Network Based Noise Modeling 是中山大學和 CVTE 發表於 CVPR 2018 的工作，該文章透過利用 GAN 對噪聲分佈進行建模，並透過建立的模型生成噪聲樣本，與乾凈影象集合構成訓練資料集，訓練去噪網路來進行盲去噪。

很多去噪問題的解法，例如基於多種影象先驗資訊的方法，如 BM3D，可以透過結合 noise-level 估計演演算法來達到盲去噪的效果。但是，這些方法還是有很大的缺陷。

首先，在這些方法中的影象先驗資訊大多基於人類知識，因此影象的全部特徵就很難被捕捉到。第二，這些方法中絕大多數都是只用了輸入影象的內部資訊，沒有使用到任何的外部資訊，所以，還有很大的提升空間。

而基於已知噪聲資訊（noise-level）的影象去噪方法，特別是基於 CNN 的方法，對於已知高斯噪聲的資訊，這些方法可以達到 SOTA 水平。而且，這些方法不需要依靠人類對於影象的先驗資訊。但是這些方法在實際中很難派上用場。因為實際中我們得到一張影象，其中的噪聲資訊是未知的。

基於上面的分析，作者的思路：透過給定的含噪聲影象構建一個配對的訓練資料集，然後透過使用基於 CNN 的方法來進行盲去噪。

構建這樣一個資料集需要透過含噪聲的影象來對噪聲分佈進行建模，然後生成噪聲資料。實際上，前面的工作已經使用 GMM（高斯混合模型）來進行對噪聲的模擬。但是得到的噪聲資料並不是和觀測得到的噪聲十分相似，因此就需要一個更好的噪聲建模方法。

作者在本文中提出了一個新穎的兩步框架。首先，訓練 GAN 以估計輸入噪聲影象上的噪聲分佈並生成噪聲樣本。其次，利用從第一步取樣的噪聲塊來構建成對的訓練資料集，該資料集又用於訓練 CNN 以對給定的噪聲影象進行去噪。

網路結構

▲ GCBD方法

噪聲建模估計

文章假設需要處理的影象都含有同一型別的未知的均值為 0 的噪聲。然後，進行噪聲建模。

1. 提取噪聲影象塊

這是正確訓練 GAN 以模擬未知噪聲的重要步驟，因為噪聲分佈將從噪聲主導資料中更好地被估計。

為了減小原始背景的影響，需要從給定噪聲影象中具有弱背景的部分中首先提取一組近似噪聲塊（或塊），例如 V。

這樣，噪聲分佈成為 GAN 學習的主要標的，這可能使 GAN 模型更加準確。在噪聲分佈的期望為零的假設下，可以透過減去噪聲影象中相對平滑的 patch (smoothed patch) 的平均值來獲得近似的噪聲 patch。

這裡討論的 smoothed patch 指的是內部內容非常相似的區域。文中的數學定義即為 patch 中各部分的均值，方差在一個很小的範圍內波動。

以步長為 Sg 對整張含噪聲影象提取影象塊 Pi，其大小為 d × d；
以步長為 Sl 對影象塊 Pi 提取區域性影象塊，其大小為 h × h；
若對於 Pi 中所有的，都滿足以下條件，就說明 Pi 為 smoothed patch，μ, γ∈(0,1)。
將每一個 smoothed patch 儲存到集合 S 中，然後各自減去各自的均值，就得到 noise patch 集合 V。

2. 利用GAN進行噪聲建模

利用剛才得到的 noise patch 集合，然後用 GAN 來對噪聲進行建模，透過建立的模型生成更多的噪聲資料。

在文章的方法中，GAN 是透過第一部得到的近似噪聲 patch 集合 V 來估計噪聲的分佈的。

由於 WGAN 可以改進 GAN 的訓練並生成高質量的樣本。因此，在文章的實驗中，WGAN-GP 是 WGAN 的改進版本，用於學習噪聲分佈。

這裡的 loss 函式為：

這裡的 Pr 表示 V 的資料分佈，Pg 是生成器生成資料的分佈。被定義為沿著 Pr 和 Pg 樣的點對之間的直線均勻分佈的取樣。

▲ GAN網路結構

作者採用類似於 DCGAN 的網路，訓練好的網路被用來生成噪聲樣本（增強集合 V）並最終得到集合 V’。

透過深度CNN進行去噪

許多以前的工作提出透過訓練具有大型資料集的 CNN 來解決去噪問題，並取得了令人矚目的成果。如前所述，CNN 可以隱含地從配對的訓練資料集中學習潛在噪聲模型，從而放鬆了對影象先驗的人類知識的依賴。因此，在文章的方法中使用 CNN 進行去噪。

為了訓練 CNN，首先需要構建一個配對的訓練資料集，從剛才得到的經過 GAN 擴充套件的 V’ 資料集，然後再從乾凈影象的資料集中透過影象分塊（patch 大小 d×d）的方法得到乾凈影象資料集 X。在 V’ 中的 noise block 隨機地加入到 X 中，得到集合 Y。其中有。然後透過集合 X 和 Y 構成配對資料集 {X,Y}。