歡迎光臨
每天分享高質量文章

【職業】如何建立一個強大的資料科學專案組合,讓您獲得一份工作

好的,你可能在這裡,因為你只有幾個月的時間畢業,你的簡歷中的專案部分是空白的。 或者你只是一個好奇的小書獃子瀏覽全球資訊網的方式來獲取那個夢想的工作。 無論哪種方式,你並不孤單,還有成千上萬的人試圖建立一個偉大的資料科學組合,以幫助他們找到一份好工作。 再看看,我們將儘力幫助您製作能吸引招聘者眼球的資料科學組合!

David“Trent”Salazar的組合是Sajal Sharma的一個很好的例子,它是一個很好的例子,展示瞭如何在像Github這樣的平臺上展示他們的資料科學組合。

公司正在尋找可以為業務增值的員工。 為了有效地在您的簡歷中展示這一點,第一步是瞭解您可以增加價值的不同方式。

讓我們把它們分解成4個廣泛的領域:

  • 從資料中獲取見解並將其呈現給商業領袖

  • 設計一個直接有利於客戶的應用程式

  • 設計直接惠及組織中其他團隊的應用程式或系統

  • 與其他團隊分享資料科學專業知識

您需要確保您的資料科學組合能夠描繪全部或至少大部分上述內容,以便輕鬆透過工作選擇。 所以讓我們看看我們能做些什麼來創造一個好的資料科學組合。

我知道我在做什麼,我猜?


因此,您要向招聘人員展示您有能力執行資料科學的關鍵方面,即匯入資料集,清理資料,使用各種技術從資料中提取有用的資訊,並最終將結果視覺化並傳達給他們。除了技術技能之外,還有一些預期的軟技能。例如,與他人溝通和協作的能力,推理和採取主動的能力。如果你的專案實際上能夠傳達這些東西,你就在!

避免去“所有地方”


你可能知道很多,但並不是把所有的技能,專案和知識都扔在僱主的面前,而是專註於做某件事並做正確的事。就像您在簡歷中所做的一樣,保持簡短而又甜蜜,您也可以在構建資料科學組合的同時實現此標的。永遠記住,面試官正在尋找特定的技能。

逆向工程


找到5-6個工作,可能來自LinkedIn或者indeed,你對這些工作感興趣並且徹底弄清楚工作的職位描述。瞭解僱主正在尋找什麼樣的技能。例如,它可以是分類,機器學習,統計建模或回歸。選擇工作所需的工具 – 例如Python,R,TensorFlow,Hadoop或任何可能完成工作的工具。如果你不知道如何使用這個工具,那麼當你在專案中工作時,你將需要學習這些技巧。此外,確定他們希望您處理的資料型別,如文字或數字等。現在,一旦掌握了這些資訊,就可以圍繞這些技能和工具開始構建專案。

繼續在現實世界中搖滾!


處理並非真正“問題”的專案並不會在您的資料科學組閤中脫穎而出。您的專案越接近現實世界,招聘人員就越容易做出選擇您的決定。這也將展示您的分析技能以及您如何應用資料科學解決普遍存在的問題。

三件小事


建立資料科學組合的好方法是列出3個不同性質的優秀專案。 這裡有一些有趣的專案讓你開始使用你的投資組合:

資料清理或處理:資料清理是資料科學家執行的最關鍵任務之一。 透過採取一組不同的資料集,鞏固並理解它們,您可以讓招聘人員確信您知道如何準備進行分析。 例如,您可以使用Twitter或Whatsapp資料並將其清理以供分析。 這個過程非常簡單; 你首先找到一個“臟”的資料集,然後找到一個有趣的角度來處理資料,清理並對其進行分析,最後呈現你的發現。

講故事:講故事不僅展示了你從原始資料中獲取洞察力的能力,還揭示了你能夠將洞察力傳達給其他人並說服他們。

例如,您可以使用您所在國家公交系統的資料,並獲得見解以確定哪些站點會造成最大的延誤。 這可以透過更改路線來解決。 確保你的分析是描述性的,你的程式碼和邏輯可以遵循。

這就是你所做的; 首先找到一個好的資料集,然後在資料中探索資料和挖掘相關性。 然後在你開始撰寫你的敘述之前你視覺化它。 從各個角度處理資料並挑選最有趣的點。 如果它對你很有趣,那麼任何正在評審它的人都可能會感興趣。 細分每個程式碼片段並詳細解釋每一步,就好像你在向朋友描述它一樣。 這個想法是在您分析過程中向審閱者傳授新內容。

端到端:如果您更多地使用機器學習或演演算法編寫,您應該做一個端到端的資料科學專案。 該專案應該能夠收集資料,處理資料並最終從中獲取資訊。

例如,您可以獲取您所在城市的燃料定價資料或股票市場資料。 資料需要動態且定期更新。 這個訣竅是保持程式碼簡單,以便安裝和執行。

你首先需要確定一個好主題。 在此理解,我們不會使用單個資料集,而是需要匯入和解析所有資料接下來,準備好訓練和測試資料做出預測。 記錄你的程式碼和其他調查結果,你很好。

資料人三項工具箱

如果你想獲得這份工作,你必須有適當的工具來完成工作。 以下是一些最流行的工具串列,其中包含適合您的技巧的正確材料的連結:

語言:Python,R,Java,Scala,SQL

BigData工具:Hadoop,Spark,Hive

ML框架:TensorFlow,Caffe2,Keras,PyTorch

視覺化工具:D3.js,Excel圖表,Tableau,ggplot2

所以你有它。 你知道該如何建立一個體面的資料科學組合。 這真的很值得參加比賽和挑戰。 它不僅可以幫助您掌握資料,並且善用自己的技能,還可以讓您更全面地瞭解人們在做什麼以及他們能夠解決問題的工具是什麼。

您在閱讀中,有什麼見解,請評論。

作者:Aaron Lazar
連結:https://hub.packtpub.com/create-strong-data-science-project-portfolio-lands-job/

版權宣告:作者保留權利,嚴禁修改,轉載請註明原文連結。

關於更多資料科學內容,請閱讀資料科學系列文章

資料人網是資料人學習、交流和分享的平臺http://shujuren.org 。專註於從資料中學習到有用知識。
平臺的理念:人人投稿,知識共享;人人分析,洞見驅動;智慧聚合,普惠人人。
您在資料人網平臺,可以1)學習資料知識;2)建立資料部落格;3)認識資料朋友;4)尋找資料工作;5)找到其它與資料相關的乾貨。
我們努力堅持做原創,聚合和分享優質的省時的資料知識!
我們都是資料人,資料是有價值的,堅定不移地實現從資料到商業價值的轉換!


親愛的讀者們,您們有什麼想法,請點選【留言】按鈕,寫下您的留言。


【資料科學與人工智慧】公眾號,誠邀各位資料人投稿,您可以原創,也可以翻譯,小編微信:luqin360,等候您。

點選閱讀原文,進入資料人網,學習資料知識。




資料人網(http://shujuren.org)誠邀各位資料人來平臺分享和傳播優質資料知識



公眾號推薦:

360區塊鏈,專註於360度分享區塊鏈內容

    腳印英語,專註於分享實用口語內容。



贊(0)

分享創造快樂

© 2024 知識星球   網站地圖