【演演算法】機器學習和資料科學最常用到的TOP10演演算法-知識星球

資料科學的實踐，需要使用演演算法和資料科學方法，來幫助資料專業人員從資料中提取洞察力和價值。Kaggle最近的一項調查顯示，資料專家在2017年比其他資料科學方法更多地使用資料視覺化、邏輯回歸、交叉驗證和決策樹技術。展望2018年，資料專業人員對學習深度學習（41％）最感興趣。

Kaggle於2017年8月對16,000多名資料專業人員進行了調查。他們的調查包括資料科學，機器學習，教育等方面的各種問題。 Kaggle釋出了原始調查資料，根據這些調查資料，我發現一些有趣的東西。今天的文章是關於2017年資料專業人員使用的資料科學和機器學習方法，以及2018年最令他們興奮的機器學習/資料科學方法。

1. 2017年最受歡迎的資料科學/分析工具，技術和語言

調查包括一個針對資料專業從業人員的問題，“在工作中，你經常使用以下資料科學方法？（選擇所有使用的）”。平均而言，資料專家在2017年使用了5種（中值）資料科學方法。2017年使用的前5種資料科學方法是（見圖1）：

資料視覺化（49％）
Logistic回歸（42％）
交叉驗證（38％）
決策樹（36％）
隨機森林（34％）
時間序列分析（31％）
神經網路（28％）
PCA和維度降低（27％）
kNN和其他聚類演演算法（26％）
文字分析（25％）

對於自稱為“資料科學家”的資料專業人員，這些方法的使用率更高。這些資料科學家的採用率大約高出15-20個百分點（例如，66％用於資料視覺化，61％用於邏輯回歸， 56％為決策樹，56％為隨機森林）。

KDNuggets最近的一項調查發現，與目前的研究結果類似。在他們的研究中，頂級資料科學和機器學習方法還包括回歸（60％），聚類（55％），視覺化（51％），決策樹/規則（51％）和隨機森林（46％）。

2. 哪些2018年學習最為興奮的機器學習和資料科學方法？

另一個調查是，所有資料專業人士（不管是否正在工作），瞭解他們在下一年最興奮的機器學習/資料科學方法。結果顯示，資料專業人員對深度學習最感興趣：

深度學習（41％）
神經網路（13％）
時間序列分析（6％）
貝葉斯方法（5％）
文字挖掘（5％）

3. 小結

Kaggle對16,000多名資料專家的調查結果，揭示了工作中使用的最流行的資料科學方法。資料視覺化和邏輯回歸列在首位。

毫不奇怪，10位資料專業人士中有4位表示，他們非常高興在明年學習深度學習。

深度學習是一類機器學習演演算法，它是根據大腦的資訊處理和通訊樣式建模的。

深度學習使用單位層或節點進行特徵提取和轉換，每層使用前一層的輸出作為輸入。

深度學習方法可用於營銷，汽車，語音識別等領域。

這種對學習深度學習興趣的同時，調查結果還表明，用於深度學習的流行的開源軟體TensorFlow是專業人士有興趣學習的頂級工具資料。

本文翻譯自：

http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work

親愛的讀者朋友們，您們有什麼想法，請點選【寫留言】按鈕，寫下您的留言。

資料人網（http://shujuren.org）誠邀各位資料人來平臺分享和傳播優質資料知識。

公眾號推薦：

360區塊鏈，專註於360度分享區塊鏈內容。

腳印英語，專註於分享實用口語內容。

閱讀原文，更多精彩！

分享是收穫，傳播是價值！

贊賞

長按二維碼向我轉賬

受蘋果公司新規定影響，微信 iOS 版的贊賞功能被關閉，可透過二維碼轉賬支援公眾號。

即將開啟”“小程式

取消
 開啟

【演演算法】機器學習和資料科學最常用到的TOP10演演算法

1. 2017年最受歡迎的資料科學/分析工具，技術和語言

相關推薦

熱門標籤

熱門文章

分享創造快樂