歡迎光臨
每天分享高質量文章

【應用】信用評分卡:高階分析


筆者邀請您,先思考:

1 信用評分卡如何做高階分析?

上一篇:信用評分卡 : 變數選擇

高階分析中的建模

當一位年輕的商業分析師向我們講述他最近回家的事件時,充滿分析師的房間爆發出一陣響亮的笑聲。 一位遙遠的阿姨詢問了他的新職業。 他的回答 – 我正在進行建模。 她興高采烈地問道 – 它只是在坡道上還是我會在電視上看到你? 開玩笑,這讓我想知道建模或模型這個詞的根源。 什麼是模型?

模型被定義為現實的簡化表示。 現實的表現,嗯,照片是現實的代表 – 在卷軸上捕捉現實的瞬間 – 這使它成為一個模型。 我想是的。 同樣,報道一個事件並將其作為突發新聞的報紙記者也是一個模型 – 描述性模型。 現在,讓我們嘗試將模型與Google Analytics相關聯。

資料倉庫,商業智慧和高階分析

由於資訊科技的出現,分析得到了巨大的推動。我們生活在大資料時代。在業務流程的每個階段收集的大量資料都需要從資訊中提取知識。這整個過程有三個方面

  • 1.資料倉庫或資料集市:事務資料被提取 – 轉換和載入(ETL)到資料模型/樣式中以進行分析

  • 2.商業智慧或儀錶板:業務報告

  • 3.預測分析或高階分析:高階統計和資料挖掘練習

隨著資料量的呈指數增長,Hadoop和大資料技術正在取代資料倉庫。但是,商業智慧和預測分析的思維過程 – 本文的重點 – 不會發生太大變化。讓我嘗試使用我在專業劇院學到的東西來區分商業智慧和預測分析。

5W用於商業智慧和預測分析 – 來自劇院的經驗教訓

幾年前我加入了一個專業劇團。 為了理解表演的細微差別,我們從即興劇開始。 這種形式的劇沒有預定義的劇本,但演員在表演時建立了故事。 大多數人都認為我是一個很好的即興演員。 然而,在表演時記住對話的風格對我來說並不是很好,因此它是我戲劇演出的結束。 但是,我從整個經歷中學到了一些好的教訓。 其中一個是解讀一個角色來製作戲劇的五個W.

  • 1.發生了什麼事?

  • 2.什麼時候發生的?

  • 3.它發生在哪裡?

  • 4.誰是這個的一部分?

  • 5.為什麼會這樣?

顯然,前四個問題試圖報告現實的現實版本 – 描述性模型。 這正是商業智慧專業人員試圖透過花哨的報告平臺和軟體實現的標的。 第五個問題是最棘手的問題。 讓科學家和好奇的頭腦在深夜醒來的問題。

牛頓的遺產

一棵蘋果從樹上掉下來。 回答前四個問題有多難? 我們大多數人都可以藉助時鐘和地圖來回答這些問題。 然而,Isaac Newton回答了第五個問題和他的回答 – Gravity。 如果他已經停在那裡,那麼在他出生後近四百年後,沒有人會想起他。 他給出了一個數學模型來解釋這種現象。

用任何其他物體替換蘋果和地球,你就可以得到模型的一般公式。 阿爾伯特愛因斯坦確實粉碎了牛頓的重力概念。 然而,這種模型仍然適用於所有實際問題,並廣泛用於火箭科學。

高階分析試圖透過預測建模來回答第五個問題,即為什麼會發生某些事情。 高階統計和資料挖掘技術與分析師的商業敏銳度相結合,可以生成幫助組織做出明智決策的模型。 請記住,這隻是一個開始,因果關係仍然是一個公平的距離!

信用評分模型

信用記分卡是預測借款人違約貸款機率的模型。 以下是具有三個變數的信用評分的簡化版本

信用評分=年齡+貸款與價值比率(LTV)+分期付款(EMI)與收入比率(IIR)

一名28歲男子的LTV為75,IIR為60,他的得分為10 + 50 + 5 = 65,因此信用風險很高。

現在的問題是,我們是如何得出儲存分數和相關風險表的? 到目前為止,在完成系列的前三篇文章之後,你必須知道我們將如何去做。 我們有一個好/壞借款人的歷史清單(文章2),我們希望使用預測變數來區分(文章3)。 有幾種統計和資料挖掘技術可以幫助我們實現我們的標的,例如

  • 1.決策樹

  • 2.神經網路

  • 3.支援向量機

  • 4.機率回歸

  • 5.線性判別分析

  • 6. Logistic回歸

Logistic回歸是最常用的技術。 我們將在下一篇文章中探討有關邏輯回歸的更多資訊。

總結

我必須在結束本文時說,優秀的分析師找到了一個很好的數學模型,就像模特走在T臺上一樣漂亮。

參考資料

  1. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi

  2. Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者:Roopam Upadhyay

原文連結

Credit Scorecards – Advanced Analytics (part 4 of 7)

版權宣告:作者保留權利,嚴禁修改,轉載請註明原文連結。

資料人網是資料人學習、交流和分享的平臺http://shujuren.org 。專註於從資料中學習到有用知識。
平臺的理念:人人投稿,知識共享;人人分析,洞見驅動;智慧聚合,普惠人人。
您在資料人網平臺,可以1)學習資料知識;2)建立資料部落格;3)認識資料朋友;4)尋找資料工作;5)找到其它與資料相關的乾貨。
我們努力堅持做原創,聚合和分享優質的省時的資料知識!
我們都是資料人,資料是有價值的,堅定不移地實現從資料到商業價值的轉換!

點選閱讀原文,進入資料人網

贊(0)

分享創造快樂