歡迎光臨
每天分享高質量文章

解決現實世界問題的四大機器學習策略

解決現實世界問題的四大機器學習策略

原文: Four machine learning strategies for solvingreal-world problems

來: https://blogs.sas.com/content/subconsciousmusings/2018/10/17/four-machine-learning-strategies-for-solving-real-world-problems/

 

導讀:

有的在線學習演算法還會“適應”,即隨時調整模型,跟隨或追蹤資料的變化。具體而言,它們會逐漸“遺忘”過時資料,從而適用於環境/模型隨時變動的應用程式。

 

原文翻譯:

機器學習有四種廣受認可的形式:監督式、無監督式、半監督式和強化式。在研究文獻中,這些形式得到了深入的探討。它們也被納入了大多數機器學習演算法的入門課程。下表對這四種形式作了總結。

Style of   Learning

Definition

Characteristic

Examples

Supervised

Supervised learning algorithms make predictions based  on a set of examples.

Data has known labels.

Insurance underwriting and fraud

Unsupervised

With unsupervised learning, there is a focus on finding  patterns and gaining insight from data.

Labels or output are unknown.

Customer clustering and market basket analysis

Semi-supervised

With semi-supervised learning, you use unlabeled  examples with a small amount of labeled data to improve the learning  accuracy.

Labels or output are known for a subset of data.

Medical predictions where tests and expert diagnoses  are expensive and only part of the population receives them.

Reinforcement

Reinforcement learning analyzes and optimizes the  behavior of an agent based on the feedback from the environment.

Focus on making decisions based on previous experience.

Robotics, gaming, navigation, complex decision problems  and reward systems.

 

但一個並不廣為人知的概念是機器學習策略,即以創造性的方式,運用基本的機器學習演算法,解決現實世界問題。我對這些策略產生了濃厚的興趣。在這篇文章中,我將探討四種策略:在線學習、遷移學習、集成學習和深度學習。好在,這四項策略適用於表格中任意一種機器學習形式。

 

一、在線學習

在線學習使用瞬息萬變的資料。這類模型跟著資料及時更新,並不儲存先前的資料。有的在線學習演算法還會“適應”,即隨時調整模型,跟隨或追蹤資料的變化。具體而言,它們會逐漸“遺忘”過時資料,從而適用於環境/模型隨時變動的應用程式。批量(或離線)學習使用靜態的資料,可以充當在線學習的熱身。在批量學習中,模型一次性完成所有資料的學習。很多在線學習演算法使用一個批量/離線演算法(以一小批資料為基礎),為模型作啟動前的熱身。這種做法可以顯著加快演算法的收斂(convergence)速度。

 

二、遷移學習

遷移學習將一個領域的知識應用到另一個領域。它將舊的資料、模型和引數用於新問題的解決,對於機器學習模型的終身學習而言至關重要。遷移學習是人與生俱來的能力。舉個例子,我們會將已經掌握的語言知識(詞彙、語法等),應用到新語言的學習中。兩種語言越是接近,知識遷移就越簡單。

 

三、集成學習

單學習器模型只用一個學習器(演算法),而集成學習使用多個學習器。一般的集成演算法包含梯度提升、引導聚集、決策森林、堆棧集成和超級學習器。集成學習可以結合相對較弱(很多情況下,預測精度只略高於隨機猜測)的學習器,產生強大、準確的模型。

 

四、深度學習

深度學習包含多個層,可以學習資料的層級化或多尺度特征。與之相對的是“淺層學習”,即簡單地運用普通的機器學習建模演算法。通常,淺層學習離不開特征工程(feature engineering),以保障輸入以適當的形式呈現給模型,而深度學習在訓練時,就自然而然地學會了這些特征。

 

在用機器學習演算法解決日常業務難題時,機器學習策略是我們要考慮的又一個方面。

「完」


本次轉自:品覺 微信公眾號(pinjueche.com)

車品覺簡介

暢銷書《決戰大資料》作者;國信優易資料研究院院長;紅杉資本中國基金專家合伙人;浙江大學管理學院客席教授;全國信標委員;資料標準工作組副組長;美麗心靈基金會桑珠利民基金副主席。

原阿裡巴巴集團副總裁,首任阿裡資料委員會會長現擔任中國信息協會大資料分會副會長、中國計算機學會大資料專家委員會副主任、粵港信息化專家委員、中國計算數學學會第九屆理事、清華大學教育指導委員(大資料專案)、浙江大學管理學院客席教授等職。

版權宣告:本號內容部分來自互聯網,轉載請註明原文鏈接和作者,如有侵權或出處有誤請和我們聯繫。

關聯閱讀

原創系列文章:

1:從0開始搭建自己的資料運營指標體系(概括篇)

2 :從0開始搭建自己的資料運營指標體系(定位篇)

3 :從0開始搭建自己的資料運營體系(業務理解篇)

4 :資料指標的構建流程與邏輯

5 :系列 :從資料指標到資料運營指標體系

6:   實戰 :為自己的公號搭建一個資料運營指標體系

7:  從0開始搭建自己的資料運營指標體系(運營活動分析)

資料運營 關聯文章閱讀:  

運營入門,從0到1搭建資料分析知識體系    

推薦 :資料分析師與運營協作的9個好習慣

乾貨 :手把手教你搭建資料化用戶運營體系

推薦 :最用心的運營資料指標解讀

乾貨 : 如何構建資料運營指標體系

從零開始,構建資料化運營體系

乾貨 :解讀產品、運營和資料三個基友關係

乾貨 :從0到1搭建資料運營體系

資料分析、資料產品 關聯文章閱讀:

乾貨 :資料分析團隊的搭建和思考

關於用戶畫像那些事,看這一文章就夠了

資料分析師必需具備的10種分析思維。

如何構建大資料層級體系,看這一文章就夠了

乾貨 : 聚焦於用戶行為分析的資料產品

如何構建大資料層級體系,看這一文章就夠了

80%的運營註定了打雜?因為你沒有搭建出一套有效的用戶運營體系

從底層到應用,那些資料人的必備技能

讀懂用戶運營體系:用戶分層和分群

做運營必須掌握的資料分析思維,你還敢說不會做資料分析

合作請加qq:365242293  


更多相關知識請回覆:“ 月光寶盒 ”;

資料分析(ID : ecshujufenxi )互聯網科技與資料圈自己的微信,也是WeMedia自媒體聯盟成員之一,WeMedia聯盟改寫5000萬人群。

    赞(0)

    分享創造快樂