歡迎光臨
每天分享高質量文章

【演演算法】整合學習

小編邀請您,先思考:

1 整合學習是什麼?

2 如何用Python或者R實現整合學習?

1 整合學習是什麼?

簡單來說,整合學習是一種技術框架,其按照不同的思路來組合基礎模型,從而達到其利斷金的目的。


2 整合學習框架

目前,有三種常見的整合學習框架:bagging,boosting和stacking。國內,南京大學的周志華教授對整合學習有很深入的研究,其在09年發表的一篇概述性論文《Ensemble Learning》

https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/springerEBR09.pdf


對這三種整合學習框架有了明確的定義,概括如下:

   bagging:從訓練集從進行子抽樣組成每個基模型所需要的子訓練集,對所有基模型預測的結果進行綜合產生最終的預測結果:

  boosting:訓練過程為階梯狀,基模型按次序一一進行訓練(實現上可以做到並行),基模型的訓練集按照某種策略每次都進行一定的轉化。對所有基模型預測的結果進行線性綜合產生最終的預測結果:



  stacking:將訓練好的所有基模型對訓練基進行預測,第j個基模型對第i個訓練樣本的預測值將作為新的訓練集中第i個樣本的第j個特徵值,最後基於新的訓練集進行訓練。同理,預測的過程也要先經過所有基模型的預測形成新的測試集,最後再對測試集進行預測:



  

整合學習不再是單一模型進行預測,而是採用了“集思廣益”的思想來更好地解決預測問題。

親愛的讀者朋友們,您們有什麼想法,請點選【寫留言】按鈕,寫下您的留言。



資料人網(http://shujuren.org)誠邀各位資料人來平臺分享和傳播優質資料知識



公眾號推薦:

360區塊鏈,專註於360度分享區塊鏈內容



閱讀原文,更多精彩!

分享是收穫,傳播是價值!


贊(0)

分享創造快樂

© 2022 知識星球   網站地圖