歡迎光臨
每天分享高質量文章

【演算法】機器學習和資料科學最常用到的TOP10演算法

資料科學的實踐,需要使用演算法和資料科學方法,來幫助資料專業人員從資料中提取洞察力和價值。Kaggle最近的一項調查顯示,資料專家在2017年比其他資料科學方法更多地使用資料可視化、邏輯回歸、交叉驗證和決策樹技術。展望2018年,資料專業人員對學習深度學習(41%)最感興趣。


Kaggle於2017年8月對16,000多名資料專業人員進行了調查。 他們的調查包括資料科學,機器學習,教育等方面的各種問題。 Kaggle發佈了原始調查資料,根據這些調查資料,我發現一些有趣的東西。今天的文章是關於2017年資料專業人員使用的資料科學和機器學習方法,以及2018年最令他們興奮的機器學習/資料科學方法。


1. 2017年最受歡迎的資料科學/分析工具,技術和語言



調查包括一個針對資料專業從業人員的問題,“在工作中,你經常使用以下資料科學方法? (選擇所有使用的)”。平均而言,資料專家在2017年使用了5種(中值)資料科學方法。2017年使用的前5種資料科學方法是(見圖1):


  1.     資料可視化(49%)

  2.     Logistic回歸(42%)

  3.     交叉驗證(38%)

  4.     決策樹(36%)

  5.     隨機森林(34%)

  6.     時間序列分析(31%)

  7.     神經網絡(28%)

  8.     PCA和維度降低(27%)

  9.     kNN和其他聚類演算法(26%)

  10.     文本分析(25%)


對於自稱為“資料科學家”的資料專業人員,這些方法的使用率更高。這些資料科學家的採用率大約高出15-20個百分點(例如,66%用於資料可視化,61%用於邏輯回歸, 56%為決策樹,56%為隨機森林)。


KDNuggets最近的一項調查發現,與目前的研究結果類似。在他們的研究中,頂級資料科學和機器學習方法還包括回歸(60%),聚類(55%),可視化(51%),決策樹/規則(51%)和隨機森林(46%)。


2. 哪些2018年學習最為興奮的機器學習和資料科學方法?




另一個調查是,所有資料專業人士(不管是否正在工作),瞭解他們在下一年最興奮的機器學習/資料科學方法。結果顯示,資料專業人員對深度學習最感興趣:


  1.     深度學習(41%)

  2.     神經網絡(13%)

  3.     時間序列分析(6%)

  4.     貝葉斯方法(5%)

  5.     文本挖掘(5%)


3. 小結


Kaggle對16,000多名資料專家的調查結果,揭示了工作中使用的最流行的資料科學方法。資料可視化和邏輯回歸列在首位。


毫不奇怪,10位資料專業人士中有4位表示,他們非常高興在明年學習深度學習。


深度學習是一類機器學習演算法,它是根據大腦的信息處理和通信樣式建模的。


深度學習使用單位層或節點進行特征提取和轉換,每層使用前一層的輸出作為輸入。


深度學習方法可用於營銷,汽車,語音識別等領域。


這種對學習深度學習興趣的同時,調查結果還表明,用於深度學習的流行的開源軟體TensorFlow是專業人士有興趣學習的頂級工具資料。


本文翻譯自:

http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work

親愛的讀者朋友們,您們有什麼想法,請點擊【寫留言】按鈕,寫下您的留言。



資料人網(http://shujuren.org)誠邀各位資料人來平臺分享和傳播優質資料知識



公眾號推薦:

360區塊鏈,專註於360度分享區塊鏈內容

    腳印英語,專註於分享實用口語內容。



閱讀原文,更多精彩!

分享是收穫,傳播是價值!


赞(0)

分享創造快樂

© 2020 知識星球   网站地图