歡迎光臨
每天分享高質量文章

【應用】信用評分卡:邏輯回歸


筆者邀請您,先思考:

1 您理解邏輯回歸分析?

邏輯回歸入門 – 你快樂嗎?

幾年前,我和妻子在英格蘭和蘇格蘭度過了幾個星期的假期。就在登上英國航空公司的飛機之前,一名空姐告訴我們,我們已升級為商務艙。快樂!度假真是一個美好的開始。一旦我們登上飛機,我們又獲得了另一個誘人的提議,可以進一步升級到頭等艙。然而,這一次,有一個問題 – 只有一個座位可用。當然,這是一種恥辱,我們無法接受這個提議。在提供頭等艙優惠之前,商務艙座位非常棒 – 順便說一下,所有免費升級。這是行為經濟學家描述為相對論和錨定的情況 – 用簡單的英語比較。錨定或比較是企業定價策略的根源,也是所有人類悲傷的根源。然而,最終度假心情接管了,我們徹底享受了商務艙。人類在適應最終情況方面非常擅長並享受它。在最困難的情況下,你會發現一些最快樂的面孔。以下是亨利米勒的一句話:“我沒有錢,沒有資源,沒有希望。我是最幸福的人“。人類的行為充滿了異常 – 充滿了謎題。以下是加強本論文的一個例子。

Lennon, McCartney, Harrison, 和 Best 是這個星球上最著名的樂隊 – 甲殼蟲樂隊的成員。 好的,我知道你發現了這個錯誤。 到現在為止,你必須說出正確的名字:John Lennon,Paul McCartney,George Harrison和Ringo Starr,而不是Pete Best。 實際上,Ringo Starr是Pete Best的替代品,Pete Best是甲殼蟲樂隊的原始常規鼓手。 皮特一定是被摧毀了,看到他的伙伴們在落後的時候冉冉升起。 錯了,在Google上搜索他 – 他是所有人中最快樂的披頭士樂隊。 現在這是違反直覺的,我想我們不知道是什麼讓我們開心。

正如在前一篇文章中所承諾的那樣,在本文中,我將嘗試使用邏輯回歸來探索幸福 – 這種技術廣泛用於記分卡開發。

Logistic回歸 – 一個實驗

我是一位徹底的經驗主義者 – 支持基於事實的管理。 因此,讓我設計一個快速而骯髒的實驗來生成資料來評估幸福感。 我們的想法是確定影響我們整體幸福感的因素/變數。 讓我列出一個生活在城市中的工作成年人的代表性因素串列:

現在,在上面的串列中加入一些其他因素,例如 – 善意的隨機行為或對朋友的無計劃訪問。 如您所見,上面的串列可以很容易地擴展(回想一下關於變數選擇的文章 – 文章3)。 這是一個代表性的清單,您必須創建自己的清單,以找出影響您的幸福水平的因素。

實驗的第二部分是收集資料。 這就像維護日記只有這一個將在Microsoft Excel中。 每天晚上睡覺之前,你可以評估你的一天,並填寫電子錶格中的數字以及當天的整體幸福水平(如下圖所示)。

經過幾年的資料收集,您將有足夠的觀察來創建模型 – 在這種情況下的邏輯回歸模型。 我們試圖在上面的資料集中用其他列(C到I)模擬幸福感(B列)。 如果我們在Y軸上繪製B並且在X軸上繪製C到I的加法組合(我們將其稱為Z),它將看起來像下麵所示的圖。

邏輯回歸背後的想法是以這樣的方式優化Z,使得我們在快樂和悲傷面孔之間得到最佳區分,如上圖所示。這是一個曲線擬合問題,其中sigmoid函式(紫色曲線)作為函式的選擇。

我建議在我們的模型中使用觀察日期(A欄);這可能會給季節帶來有趣的影響。

銀行和金融業的應用

這正是我們在分析記分卡(例如信用評分卡,行為評分卡,欺詐評分卡或購買傾向模型)的情況下所做的事情。用來替換快樂和悲傷的面孔

  • 好的和壞的借款人

  • 欺詐和真實案件

  • 買家和非買家

對於相應的情況,你有模型。如果您記得上一篇文章4,我已經展示了一個簡單的信用記分卡模型:信用評分=年齡+貸款與價值比率(LTV)+分期付款(EMI)與收入比率(IIR)

Sigmoid函式的直接轉換將幫助我們得到線的上述等式。這是到達所需評分卡的最後一個鏈接。

信用評分卡中的變數轉換

我喜歡電影Kill-Bill這兩部分。 在第一部分中,當Uma Thurman的角色去日本從傳說中的劍士HattoriHanzō手中拿劍時,我很享受。 在瞭解了她的動機之後,他同意為她做出最好的劍。 然後電影導演昆汀·塔倫蒂諾(Quentin Tarantino)簡要介紹了製作劍的過程。 HattoriHanzō將一塊普通的鐵片變成了神話般的劍 – 這真是一個工匠。 這與分析師如何將S形函式轉換為線性方程非常相似。 不同之處在於,分析師使用數學工具而不是鎚子,並不像HattoriHanzō那樣具有傳奇色彩。

拒絕推理

拒絕推斷是信用或應用記分卡的一個顯著方面,它與所有其他分類模型不同。 對於應用記分卡,由於拒絕貸款缺乏績效,開發樣本存在偏差。 拒絕推斷是一種糾正這一缺點並消除樣本偏差的方法。 我們將在後面有關您的CANalytics的文章中詳細討論拒絕推斷。

總結

現在我們已準備好評分卡,下一個任務是驗證評分卡的預測能力。 這正是我們將在下一篇文章中做的。 再見。

參考資料

  1. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi

  2. Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者:Roopam Upadhyay

原文鏈接

Credit Scorecards – Logistic Regression (part 5 of 7)

版權宣告:作者保留權利,嚴禁修改,轉載請註明原文鏈接。

資料人網是資料人學習、交流和分享的平臺http://shujuren.org 。專註於從資料中學習到有用知識。
平臺的理念:人人投稿,知識共享;人人分析,洞見驅動;智慧聚合,普惠人人。
您在資料人網平臺,可以1)學習資料知識;2)創建資料博客;3)認識資料朋友;4)尋找資料工作;5)找到其它與資料相關的乾貨。
我們努力堅持做原創,聚合和分享優質的省時的資料知識!
我們都是資料人,資料是有價值的,堅定不移地實現從資料到商業價值的轉換!

赞(0)

分享創造快樂