論文落地 101：演演算法工程化的那些坑-知識星球

筆者就職於泛化智慧，一家專註於 AI 落地的計算機視覺公司。三年來，我們服務了大量需要 AI 的行業，比如電網、醫院、無人機、機場甚至野生動物保護。在做這些專案的過程中，我們積累了很多經驗（踩過很多，也挖過很多坑）。為了避免在工程中重覆犯錯，我們內部在做工程專案前，都會根據下麵這個 check list 逐條檢查。這裡擴充套件一下，整理為 AI 落地中的常見問題，分享給大家：

你有顯示卡，我有顯示卡，但使用者有顯示卡嗎？

也許你不相信一個擁有幾百人 IT 團隊的公司會沒有顯示卡，不過你真的確定你使用者那裡有顯示卡嗎？在自己公司或者實驗室內部，我們的硬體條件基本都能得到滿足；但到了使用者那裡，一切可能都不一樣了。

有很多專案，必須要在客戶的電腦/伺服器上去執行，而很多環境下是沒有 GPU 的——或者說，如果你做工程化，GPU 可能是種奢侈品。對於計算機視覺專案來說，假如客戶需要把模型搭載到他特有的硬體上（比如智慧製造領域的缺陷檢測裝置），事先與使用者確認硬體配置是至關重要的。

一個簡單的判別標準：和客戶交流的時候，客戶知不知道什麼是 GPU，絕對是合作難易程度的分水嶺。知道且清楚什麼是 GPU 的，合作起來會更簡單；而如果對 GPU 一無所知的，或者只用過 Intel GPU的，專案落地難度就指數級增加。

顯示卡難求，務必事先與使用者溝通。

資料有了嗎？

我們所有專案，內部討論時的第一個問題一定是：這專案有資料嗎？

技術人員復現論文的時候，往往會有現成的資料集，清洗過的資料。一旦開始做工程化，取得資料集和資料集預處理才是最耗費時間的環節。我們接過很多專案，所有商務細節都談好了，專案啟動後，技術人員才發現客戶沒資料，或者資料不夠。

資料有了，你……能看懂嗎？

接著上一個問題，對於絕大部分計算機視覺專案來說，客戶的資料我們真不一定能看懂。比如醫療影像，資料標註是醫生都需要經過多年培訓才能做好的事情，沒有任何醫療背景的程式員很難在短時間內看懂這些資料。年初的時候我們給某工廠做缺陷識別，用什麼網路什麼部署樣式都想好了，結果就是看不懂圖片不能做標註。我們看所有地方都像是壞了，但工廠的質檢員就能一眼分辨出來正常和缺陷。這種行業的 know how 很重要。

▲ 心臟造影圖，非醫務人員很難看出圖中哪些是對診斷有幫助的血管

你瞭解對方的預期嗎？

由於近年來媒體對人工智慧行業誇大其詞的報道，給大家造成了一種印象「人工智慧是萬能的」。使用者與技術人員的資訊不對稱性就導致了對專案不同的預期。面對完全沒接觸過人工智慧的使用者，要確保使用者明白以下幾點：

1. 只保證測試集的準確率，但不能保證這個準確率在任何跟訓練資料相差非常遠的情況下，還能復現；

2. 機器學習專案不能做到 100% 的準確率；

3. 訓練需要時間，不像是買個 Microsoft Office 下載就能用。

最後，工程化最煩的一點是，我們要給客戶做特別多的 demo。任何一個需求都需要先給他們做個 demo 看看。這些 demo 太浪費時間了，但又不能不做。所以我們為了節省每個計算機視覺專案的時間，製作了 TeguCV——一款視覺化計算機視覺以及神經網路工具。

TeguCV 支援 Windows，純本地執行，目前支援影象識別、影片分類、人臉比對和車牌識別，同時包含自動引數選擇、http server 等功能。十分鐘開始訓練計算機視覺模型。很多簡單工作，直接用 TeguCV 就能實現。方便開發者快速做技術落地，而且可以把很多簡單工作剝離出來。

▲ TeguCV軟體截圖

比如點選閱讀原文，就可以看到我們如何用半小時內的時間，為無人機航拍影象做識別。

掃描下方二維碼新增客服可以獲得 TeguCV 免費下載連結。

現在，在「知乎」也能找到我們了

進入知乎首頁搜尋「PaperWeekly」

點選「關註」訂閱我們的專欄吧

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域，歡迎在公眾號後臺點選「交流群」，小助手將把你帶入 PaperWeekly 的交流群裡。

▽ 點選 | 閱讀原文 | 檢視案例分享

論文落地 101：演演算法工程化的那些坑

相關推薦

熱門標籤

熱門文章

分享創造快樂