歡迎光臨
每天分享高質量文章

論文落地 101:演算法工程化的那些坑

筆者就職於泛化智慧,一家專註於 AI 落地的計算機視覺公司。三年來,我們服務了大量需要 AI 的行業,比如電網、醫院、無人機、機場甚至野生動物保護。在做這些專案的過程中,我們積累了很多經驗(踩過很多,也挖過很多坑)。為了避免在工程中重覆犯錯,我們內部在做工程專案前,都會根據下麵這個 check list 逐條檢查。這裡擴展一下,整理為 AI 落地中的常見問題,分享給大家:

你有顯卡,我有顯卡,但用戶有顯卡嗎?

也許你不相信一個擁有幾百人 IT 團隊的公司會沒有顯卡,不過你真的確定你用戶那裡有顯卡嗎?在自己公司或者實驗室內部,我們的硬體條件基本都能得到滿足;但到了用戶那裡,一切可能都不一樣了。 


有很多專案,必須要在客戶的電腦/服務器上去運行,而很多環境下是沒有 GPU 的——或者說,如果你做工程化,GPU 可能是種奢侈品。對於計算機視覺專案來說,假如客戶需要把模型搭載到他特有的硬體上(比如智慧製造領域的缺陷檢測設備),事先與用戶確認硬體配置是至關重要的。 


一個簡單的判別標準:和客戶交流的時候,客戶知不知道什麼是 GPU,絕對是合作難易程度的分水嶺。知道且清楚什麼是 GPU 的,合作起來會更簡單;而如果對 GPU 一無所知的,或者只用過 Intel GPU的,專案落地難度就指數級增加。 


顯卡難求,務必事先與用戶溝通。   

資料有了嗎?

我們所有專案,內部討論時的第一個問題一定是:這專案有資料嗎?


技術人員復現論文的時候,往往會有現成的資料集,清洗過的資料。一旦開始做工程化,取得資料集和資料集預處理才是最耗費時間的環節。我們接過很多專案,所有商務細節都談好了,專案啟動後,技術人員才發現客戶沒資料,或者資料不夠。

資料有了,你……能看懂嗎?

接著上一個問題,對於絕大部分計算機視覺專案來說,客戶的資料我們真不一定能看懂。比如醫療影像,資料標註是醫生都需要經過多年培訓才能做好的事情,沒有任何醫療背景的程式員很難在短時間內看懂這些資料。年初的時候我們給某工廠做缺陷識別,用什麼網絡什麼部署樣式都想好了,結果就是看不懂圖片不能做標註。我們看所有地方都像是壞了,但工廠的質檢員就能一眼分辨出來正常和缺陷。這種行業的 know how 很重要。


 心臟造影圖,非醫務人員很難看出圖中哪些是對診斷有幫助的血管


你瞭解對方的預期嗎?


由於近年來媒體對人工智慧行業誇大其詞的報道,給大家造成了一種印象「人工智慧是萬能的」。用戶與技術人員的信息不對稱性就導致了對專案不同的預期。面對完全沒接觸過人工智慧的用戶,要確保用戶明白以下幾點:


1. 只保證測試集的準確率,但不能保證這個準確率在任何跟訓練資料相差非常遠的情況下,還能復現;


2. 機器學習專案不能做到 100% 的準確率;


3. 訓練需要時間,不像是買個 Microsoft Office 下載就能用。


最後,工程化最煩的一點是,我們要給客戶做特別多的 demo。任何一個需求都需要先給他們做個 demo 看看。這些 demo 太浪費時間了,但又不能不做。所以我們為了節省每個計算機視覺專案的時間,製作了 TeguCV——一款可視化計算機視覺以及神經網絡工具。


TeguCV 支持 Windows,純本地運行,目前支持圖像識別、視頻分類、人臉比對和車牌識別,同時包含自動引數選擇、http server 等功能。十分鐘開始訓練計算機視覺模型。很多簡單工作,直接用 TeguCV 就能實現。方便開發者快速做技術落地,而且可以把很多簡單工作剝離出來。


 TeguCV軟體截圖

比如點擊閱讀原文,就可以看到我們如何用半小時內的時間,為無人機航拍圖像做識別。


掃描下方二維碼添加客服可以獲得 TeguCV 免費下載鏈接。


?


現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關註」訂閱我們的專欄吧

關於PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

▽ 點擊 | 閱讀原文 | 查看案例分享

赞(0)

分享創造快樂