歡迎光臨
每天分享高質量文章

【教程】機器學習Python教程:2機器學習術語


筆者邀請您,先思考:

1 你熟悉和理解機器學習那些專業術語?舉例說明

分類器

將未標記的實體映射到類的程式或函式稱為分類器。

混淆矩陣

混淆矩陣,也稱為關聯表或錯誤矩陣,用於可視化分類器的性能。

矩陣的串列示預測類的實體,行表示實際類的實體。(註意:也可以反過來。)

對於二進制分類,表有兩行兩列。

例如:

這意味著分類器在42個案例中正確地預測了為男性,並錯誤地預測了8個男性案例為女性。它正確地預測了32例女性,18例被錯誤地預測為男性而不是女性。

正確度(錯誤率)

準確性是一種統計度量,定義為分類器所做的正確預測的數除以分類器所做的預測的總和。

我們前面例子中的分類器正確地預測了42個男性實體和32個女性實體。

因此,可以通過以下方法計算精度:

正確度=(42 + 32)/(42 + 8 + 18 + 32)

這是0.72

假設我們有一個分類器,它總是預測“女性”。在這種情況下,我們的準確度為50%。

我們將展示所謂的準確性悖論。

垃圾郵件識別分類器由以下混淆矩陣描述:

該分類器的精度為(4 + 91)/ 100,即95%。

下麵的分類器只預測“ham”,並且有同樣的準確性。

這個分類器的準確度為95%,即使它根本不能識別任何垃圾郵件。

Precision and Recall

Accuracy: (TN+TP)/(TN+TP+FN+FP)

Precision: TP/(TP+FP)

Recall: TP/(TP+FN)

監督式學習

機器學習程式同時給出輸入資料和相應的標簽。這意味著學習資料必須事先由人類標記。

無監督學習

學習演算法沒有標簽。演算法必須計算出輸入資料的簇。

強化學習

計算機程式與它的環境進行動態交互。這意味著程式接收到積極和/或消極的反饋,以改進性能。

原文鏈接:
https://www.python-course.eu/machine_learning_terminology.php

版權宣告:作者保留權利,嚴禁修改,轉載請註明原文鏈接。

資料人網是資料人學習、交流和分享的平臺http://shujuren.org 。專註於從資料中學習到有用知識。
平臺的理念:人人投稿,知識共享;人人分析,洞見驅動;智慧聚合,普惠人人。
您在資料人網平臺,可以1)學習資料知識;2)創建資料博客;3)認識資料朋友;4)尋找資料工作;5)找到其它與資料相關的乾貨。
我們努力堅持做原創,聚合和分享優質的省時的資料知識!
我們都是資料人,資料是有價值的,堅定不移地實現從資料到商業價值的轉換!

點擊閱讀原文,進入資料人網,獲取資料知識。

赞(0)

分享創造快樂