用AI給裸女自動“穿”上比基尼，媽媽再也不擔心我“辣眼睛”了-知識星球

導讀：網際網路的內容繁雜，一不小心就會看到一些“辣眼睛”的內容，比如裸女，這也是為什麼我們需要審核人員的存在。當然，受益於 AI 技術的發展，現在很多審核工作已經自動化了。不過，僅僅識別出來還不夠，要是能為她們穿上衣服就更好了。

來源：人工智慧頭條（ID：AI_Thinker）

南大河州天主教大學（Pontifícia Universidade Católica do Rio Grande do Sul）是巴西南大河州的一所天主教私立大學，這裡的研究人員為了不讓那些裸露的圖片汙染大眾的眼睛煞費苦心，特意開發了一種技術，為裸女們自動“穿”上比基尼。當然，這也是為了她們好，畢竟裸照在網上流傳並不是一件好事。

下麵，我們就為大家簡單介紹下這項工作。

01 摘要

我們可以將裸體和色情資訊的審查工作視為二分類任務，分類的結果用於決定是否能夠完全忽略所訪問的內容。這樣的方法可能會損害使用者的體驗，因為無論是影象還是影片，最終都必須被移除或者阻斷。

在本文中，我們提出了一種正規化轉換來過濾掉影象中的一些敏感區域，而不是檢測並移除識別的內容，並將其用於成人審查任務。為此，我們基於對抗訓練的方法開發了一種影象翻譯技術，它能夠隱式地定位出影象中的敏感區域，併在保留語意資訊的同時改寫該區域。

我們在裸體女性影象上測試這種新穎的方法，我們的方法能夠為裸體自動進行生成比基尼並改寫敏感部位，而不需要額外標註身體部位的工作。

02 方法

我們將敏感內容區域 X 的影象 x (包含女性裸體影象) 翻譯到非敏感內容域 Y 的影象 y (包含比基尼女性的影象)，這個過程我們在保留敏感區域語意資訊的同時，用比基尼改寫了影象中的敏感區域。此任務所需的資料很容易獲得，分別來自影象 X 和 Y 域，且不需要特殊資料標註。我們使用的兩個域資料是從網上爬取的，包括裸體女性和穿比基尼女性的照片。

我們對結果進行過濾，僅保留單個人出現的影象並將該資料集進一步分為訓練和測試集。對於穿比基尼女性 (X)，最終有 1044 張訓練影象和 117 張測試影象；而對於裸體女性 (Y)，最終有 921 張訓練影象和 103 張測試影象。

我們提出的方法在影象轉換過程無需資料配對，其模型結構如下圖 1 所示。該模型的關鍵思想在於利用對抗性訓練的方式來學習域之間的現實對映。

具體來說，框架由兩個對映生成器組成，G：X → Y 和 F：Y → X 和兩個判別器 DX和DY 構成。其中 DX 用於區分真實影象 {x} 和翻譯影象 {F (y)} = {^x}，而 DY 用於區分真實影象 {y} 和翻譯的影象 {G(x)} = {^y}。

我們採用了 LSGANs 中的損失函式，它能夠更穩定的訓練以產生不錯的結果表現。為了很好地衡量跨領域影象的相似度，我們還探索了 cycle-consistent 的性質並用於衡量影象翻譯結果的質量。