歡迎光臨
每天分享高質量文章

文科生12周培訓後成為谷歌大腦AI科學家?當事人說:你想多了

導讀:谷歌大腦科學家 Sara Hooker 的經歷最近被《經濟學人》當做典型報道了——但這件事卻讓她感到非常擔憂。這位女科學家有著傳奇的經歷:出生在非洲,本科在卡爾頓學院學習經濟學,沒有博士學位,卻成為了谷歌大腦的一名研究科學家。

她曾在 fast.ai 上接受過 12 周機器學習兼職課程,這成為了經濟學人介紹的重點。不過,Hooker 本人在文章發出之後自己撰文表示:我的成功無法複製。

作者:Sara Hooker

來源:機器之心(ID:almosthuman2014)編譯

▲Jeff Dean 轉發了 Hooker 的部落格,並表示:現在我很自豪能夠與她共事

以下為 Sara Hooker 的自述:

在最新一期的《經濟學人》上,有一篇題為《New schemes teach the masses to learn AI》的文章。該文講述了 fast.ai 對我所獲成功的影響。

fast.ai 是舊金山灣區一個非營利性組織,旨在揭露深度學習之謎,讓大家能夠使用這項技術。我在文中被作為一個成功的案例提及——「fast.ai 的首屆畢業生 Sara Hooker 在完成課程後被谷歌錄用,加入了競爭激烈的 AI 實習專案(AI Residency Program),她之前從未從事過深度學習。」

該文內容引起了我的極度不適,一方面,我無法否認對 fast.ai 的認可,Rachel 和 Jeremy 都是我欽佩的人,是他們為世界各地成千上萬的學生提供了進入這個領域的渠道,這種做法在同行中尚屬首次。

然而,我又做不到忽視該文引起的不適感,因為它這種簡化的敘述會誤導其他想要進入這一領域的人。

我的確參加了 fast.ai 的第一期課程,也的確在後來加入了谷歌大腦的 AI 實習專案。但是,將我的成功完全歸因於 12 周的晚間課程(part 1 和 part 2)不僅有些牽強,還會給那些想要自學機器學習的人留下一種灰姑娘快速華麗轉身的錯誤印象。而且這種表述將我自身的努力和成長弱化了。

我一度非常清楚自己喜歡做什麼。本科期間,我既沒有接觸過機器學習,也沒有接觸過電腦科學。在成長過程中,我曾待過非洲、莫三比克、萊索托、史瓦濟蘭和南非。我的家人現在定居於利比裡亞的蒙羅維亞。

我的第一次美國之旅是去明尼蘇達州,在那裡我拿著獎學金上了一所名為 Carleton College 的小型文科學校。我去參加國際學生定向活動之前,從未見過校園。來自非洲的我甚至不知道明尼蘇達州的冬天有多冷。

雖然天氣很惡劣,但我仍享受了四年學習文科課程和主修經濟學的美好校園時光。我曾經的夢想是成為世界銀行的經濟學家。這與我童年時期接觸到的大多數技術人員都是來自國際貨幣基金組織和世界糧食計劃署等組織的經濟學家不無關係。

我決定畢業幾年後再申請經濟學博士學位,因為我當時想和舊金山灣區的經濟學博士一起研究反壟斷問題。我們將經濟建模和統計應用於現實世界的案例和資料集,以評估是否存在價格操縱或公司是否濫用權力欺騙消費者。

▲2014 年初,Delta Analytics 首次對舊金山灣區的非盈利機構進行展示

搬到舊金山幾個月之後,我和其他幾個經濟學者(Jonathan Wang、Cecilia Cheng、Asim Manizada、Tom Shannahan 以及 Eytan Schindelhaim)開始在週末會面,充當非營利機構的志願者。

我們並不清楚自己所做的事有何意義,但我們覺得將自己的資料技巧免費提供給非營利機構可能是一種有用的回報方式。我們給舊金山灣區的一些非盈利機構發了郵件,得到的回應之多出乎意料。

我們發現,許多機構有自己的資料,但卻不知道如何利用這些資料加速自己的發展。那一年,我們以 Delta Analytics 的名稱註冊了一家非盈利機構,許多工程師、資料分析員及研究人員加入我們成為志願者。

Delta 仍然完全依靠志願者運營,沒有一名全職員工,大家都免費為非盈利機構提供服務。截止到我申請加入谷歌大腦實習專案時,我們已經完成了 30 餘家非盈利機構的專案。

▲Delta Analytics 第二批志願者團隊(2016)

Delta 是我人生中的一個轉折點,因為合作機構提供的資料通常是雜亂、非結構化的。而我們需要用到的線性模型(比如同方差、無自相關,正態分佈)他們卻很少提供。我親歷了經濟學家最喜歡的工具——線性函式的失敗。我決定去瞭解更多複雜的建模形式。

我加入了一家名為 Udemy 的初創公司,擔任資料分析員。這家公司有 150 人,致力於幫助任何人學習任何東西。我的老闆將頗具挑戰性且影響廣泛的專案交給我,有利於提高我技術方面的能力。我入職第一年做的重要專案之一是收集資料,開發、部署 Udemy 的首個垃圾郵件檢測演演算法。

做垃圾郵件檢測的專案讓我立志在技術工程師的道路上繼續成長。我想快速迭代,對手裡的模型進行端到端的控制,包括將其部署到生產中。這項工作需要精通程式設計。在職業生涯早期,我已經學過了 STATA(一個類似 MATLAB 的統計程式)、R 和 SQL。

如今,我想玩轉 Python。我在 Hackbright 上夜晚補習班,多數時候都是早上 4 點起床,趕在上班之前練習程式設計。直到現在我還保留著這個習慣,只不過我現在是利用這段時間讀與我的研究領域沒有直接關聯的論文,為我想學的其它領域騰出時間。

半年之後,儘管我的程式設計能力得到提高,但去應聘工程師還不夠熟練。那時候,Udemy 資料科學團隊與我的 Analytics 團隊是分離的。Udemy 在我身上投資。他們批准我轉到工程崗位,成為首個非博士資料科學家。

我從推薦演演算法入手,學習如何在數百萬人中大規模部署模型。向工程領域的轉變加速了我的技術成長,允許我繼續自己的工程師進階之路。

▲Udemy 資料團隊

在 Udemy 成長的同時,我仍在參與 Delta 專案。其中有兩個專案我非常喜歡,首先是(與 Steven Troxler, Kago Kagichiri, Moses Mutuku 一起)在肯亞內羅畢與 Eneza Education 公司合作的專案。這是一家科技教育公司,使用非智慧手機讓 400 多萬中小學生透過手機簡訊參加練習測驗。

Eneza 的資料提供了關於肯亞手機使用情況以及社群學習實踐的精彩見解。我們的工作是找出阻礙學生參與活動的困難測驗,並改進針對個人需求與能力的定製方法。第二個是(與 Sean McPherson, Stepan Zapf, Steven Troxler, Cassandra Jacobs, Christopher Kaushaar 一起)和 Rainforest Connection 合作的專案。

這個專案旨在利用來自雨林的流音訊(streamed audio)識別非法砍伐森林的行為。我們做出將音訊轉換成光譜圖的設施,並使用摺積神經網路進行分類。我們還研究了一些模型以便更好地對回收手機測驗到的聲音進行三角測量。

2017 年初,我決定開設一個課程來介紹機器學習的基本原理。我的動機是希望將 Delta 從一個彌補技能差距的非營利性組織轉變為一個在世界各地建立技術力量的組織。透過增強當地社群利用其資料的能力,我們鼓勵更加可持續發展的長期幹預。

我離開了 Udemy,開始全心和 Delta 的一群志願者(Hannah Song, Amanda Su, Jack Pfeiffer, Rosina Norton, Emily Rourke, Kevin Pan, Melissa Fabros)開發包含理論和編碼模組課程。

我和 Hannah Song 一起搬到了肯亞內羅畢,開始試點授課。我們透過呼叫 Kiva API 來提取過去 10 年在肯亞發放的所有貸款,然後構建了一個本地資料集。

Melissa Fabros, Lina Huang and Sydney Wong 目前在摩洛哥的加迪爾教授這個課程,教學團隊也隨之成長,成員包括 Brian Spiering, Mario Carrillo, Thuongvu Ho and Parikshit Sharm。

▲在肯亞內羅畢舉辦的 Delta Analytics 試點課程

總之,上述就是我在參加 fast.ai 課程之前的四年奮鬥過程。我不知道能夠加入 Google AI residency 計劃的原因,我認為這不僅僅是因為我上過 fast.ai 課程。

這不是說 Rachel 和 Jeremy 做的事沒有價值,fast.ai 非常特別:它是可獲取、賦能和民主化的一部分。我與 fast.ai 的願景及其社群有很深的聯結。此外,Rachel 和 Jeremy 在我職業生涯每一個拐點都幫助了我。

然而,我擔心的是,《經濟學人》中的故事不僅取代了我自己的敘述,而且對在這個領域開始工作的所有都設定了不切實際的期望。這篇文章沒有突顯這條路有多難,如果短期內沒有達到標的,學生們可能會質疑自己。

這裡有一個令人難以接受的真相,即單憑努力幾乎無法取得成就。在這條路上有很多人相信我,將我推出舒適區,給我影響廣泛、舉足輕重、能讓我大展拳腳的專案。我從舊金山的經歷中受益良多,那裡彙集了許多技術達人,讓我可以獲得指導、沉浸在有趣的技術中。

此外還有運氣的因素。谷歌大腦實習專案幾年前並不存在。我是該專案歷程中的第二批成員。專案的初衷和 fast.ai 的動機一樣具有革命性;該專案旨在為來自多領域的人開闢研究領域。從其他頂級研究實驗室(Uber、Facebook、Microsoft、OpenAI)宣佈的專案數量來看,該專案的成功是顯而易見的。

我們的領域需要更高的多樣性。必須有更多像我這樣的人受到歡迎,同時也能接觸到獲得成功的工具。不過,人們做好成功準備的一部分在於理解它具有多大挑戰性,在進發的道路上會遇到多少失敗。《經濟學人》認為,在為期 12 周的兼職課程結束之後萬事大吉,這是具有誤導性的。

谷歌大腦並不是職業的終點:我熱愛這個工作,也非常喜歡自己的同事們,但我仍然需要謹慎地強調這一點。在這個世界上仍然有很多人正在解決重要的問題——但卻不是在谷歌工作的。

如果你正在考慮開始自己的自學之旅,就必須事先問自己一個問題:如果你不加入谷歌,是否還對機器學習充滿熱情?如果你的答案並不確定,請謹慎行事。

最後,研究永無止境。我在一個自己喜歡的領域裡工作,同事們不斷激勵著我。谷歌大腦讓我有機會進行深度神經網路可解釋性和模型壓縮的重要研究。我也有機會參與迦納阿克拉 Moustapha Cisse 領導的谷歌大腦實驗室的一部分。

有意思的是,當你知道的越多,你就越發感覺自己無知。我對很多子領域的接觸依然有限。我仍在不斷地問問題,在對於概念不明確的時候及時跟進。我不會裝作理解自己不懂的東西。不過,我不同尋常的背景為自己帶來了一些優勢:我有著同事們不常有的見解,而我涉足不同領域的經歷也讓自己經常找到一些新穎的解決方法。

▲與谷歌 AI 成員 Jonas Kemp 和 Kathryn Rough 共同慶祝入職一週年

從 2017 年起,我開始教授機器學習基礎知識,我的動機與 Rachel 和 Jeremy 相同。我們並不是孤軍奮戰,有像 Deep Learning Indaba、AIMS 碩士專案、Data Science Africa、深度學習暑期學校以及 Distill.pub 等旨在面向入門者的課程。我希望透過課程讓所有對機器學習感興趣的人理解這個領域的基本概念。

對於一些人來說,機器學習或許會成為一時的興趣;對於另一些人來說,這可能是他們成為研究者、工程師、資料科學家、分析師的起點。兩種結果都非常有意義。機器學習社群需要百家爭鳴,以深入討論技術對於社會的影響。

我們更需要鼓勵那些希望對於新方法和應用有所貢獻的人。毫無疑問,我們的旅途還在進行中,儘管緩慢,但一直是充實的。

原文地址:

https://medium.com/@sarahooker/slow-learning-d9463f6a800b

據統計,99%的大咖都完成了這個神操作


更多精彩


在公眾號後臺對話方塊輸入以下關鍵詞

檢視更多優質內容!


PPT | 報告 | 讀書 | 書單

Python | 機器學習 | 深度學習 | 神經網路

區塊鏈 | 揭秘 | 乾貨 | 數學

猜你想看

Q: 你已在自己的行業中努力了多久

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩,請在後臺點選“歷史文章”檢視

贊(0)

分享創造快樂