了解金融業者擁有哪些資料,又可以利用這些資料達成什麼樣的目標之後,讓我們來看一下更- 具體的例子。
這個小單元將以保險業為例,讓我們去了解資料分析如何讓我們更加地了解客戶。
包括客戶的行為、 客戶與商品之間的關係以及客戶的分佈等等。
讓我們一起去思考,企業更加了解客戶,可以為他們帶來什麼樣額外的好處,
而為了獲得這些好處,企業除了要做資料分析之外,又應該搭配什麼樣的策略呢?
>> 好,那接下來我們要開始 拿實際上的產業的案例,來跟各位具體地分享說
到底資料分析在金融或財務領域裡面可以應用在哪邊。
我相信各位一定非常地好奇,那老師這邊舉一個實際上產業的例子,
我們就拿金融裡面一個非常大的產業的例子,是保險業的例子來做示範。
首先在這個我們的投影片上面大家可以看到,
我們的,這就是一個很典型的一個具體而微的 保險業的資料庫,具體而微的意思是說它裡面包含了
保戶的資料,比如說他的性別、 他的年齡、 他的婚姻狀況,這就是保戶的資料。
它裡面也包含了它的產品的資料,比如說保險公司我們 粗括地分,可以把他們的保險分成是意外險、
壽險或者是健康險這三種,然後接下來呢這些
保戶跟這些商品它們彼此之間產生的不論是繳費或者是理賠的關係,
我們這邊也舉了一個例子,就是說它在支付的方法上是可以抵繳
保費,還是是用紅利的方法,或沒有紅利,或者是用現金發放的方法。
所以總括而言,這一張簡單的資料表格裡面已經包含了客戶資料、 商品資料跟
交易資料,那我們把這三類的資料放在一個表格裡面呢,我們想要去解答一個問題是說,
我們用了這些資料之後,是不是可以去了解說,那我們
企業裡面,我們保險公司裡面,什麼樣的保戶回去買什麼樣的商品,
所以我們有一個目標是希望去了解這些保戶們都會去購買哪些商品。
那這邊給各位一個概念是說,我們最常用的第一個就是用觀察法,
那我們可能可以從這裡面去觀察說,什麼樣的性別,什麼樣的年齡,他有沒有結婚,有沒- 有子女,
然後以及這個保費他支付的方法是有紅利、 沒有紅利,還是用現金,
這個會不會跟他們所購買的商品種類產生關係呢?
更摘要地來說就是我們需要了解說購買這些保險商品的
購買決策因素到底是哪些,有哪些欄位是重要的,哪些欄位是可能比較不重要的?
那我們通常像這種資料,這邊的資料可能只有數十筆,
我們大部分用肉眼觀察可能可以看出一些規則,可是你要想像我們在真的實體世界
很多的保險公司它都有上百萬、 上千萬的保戶,
這麼眾多眾多的這些資料,不太可能是用人的肉眼去看, 這個時候我們就必須要借助於一些資料分析的工具跟技巧。
那在下一頁 我們就看到就是說,我們如果用大家比較常用的一些資料的分析工具
不管是商業的,或者是現在免費開源的,很多都有 它其中有一項資料分析功能叫做決策樹分析,
決策樹分析它其實就是,你只要設定了它的目標欄位,它就會自動幫你
歸納出來到底有哪些因素是跟這個目標欄位最相關的。
以這個例子而言,我們剛剛上一頁看到說,我們想知道到底 消費者購買保險的決策因素到底是哪些,
這個時候我們只要透過這樣的工具,把剛剛的資料餵進去, 經過一些參數的設定之後,它就會產生一個這樣的樹狀圖。
那這個樹狀圖也跟各位來解說怎麼來閱讀, 首先第一個它是要從上往下看,它跟一般的樹感覺不太一樣,
它最上面是起點,那我們從上面,這就好像大家小時候 常常玩過一種捲紙走地圖的遊戲,你就從上面這樣子一路走下來,
它就會告訴你說第一個碰到的決策因素是什麼。
那我們以這個 例子來看,發現說買這些保險
跟性別也無關,跟年齡也無關,原來第一個決策因素是跟他的子女數最有關係。
子女數如果大於 1 的人,幾乎在剛剛的資料裡面統統都購買壽險,
在剛剛的若干筆資料裡面,有 8 筆完全符合這個。
那如果是子女數是小於等於 1 的情況下, 這個時候要判斷的因素是他有沒有結婚,
如果他是未婚的話,則大部分他們都會購買意外險, 如果他是已經已婚的情況下,這個時候又要再接著
來看是他如果性別是男生,或者性別是女生, 如果他是子女數小於等於
1,已婚的狀況,然後性別是男生,則大部分會購買 意外險。
如果是女生的話,則大部分會購買健康險。
所以我們等於是透過這個決策樹, 它幫我們摘要出來一條一條的決策規則。
怎麼說呢? 其實你仔細看這個決策樹,從起點這邊開始走,
那老師畫一下它的走的方向,像這樣子走到一個終點的時候,這就叫做一條決策規則。
就是意思是說,子女數小於等於 1,而且是未婚,則大部分的客戶都會購買意外險。
這個也就是我們能夠從大量的資料,透過決策樹的分析,
幫我們去歸納出來這些決策的規則,構成的這個結構就叫做決策樹。
接下來老師介紹一下,我們這種決策樹一般就是稱之為,它也可以稱之為決策模型。
那樹只是一種模型的呈現的方法之一,我們之後等一下還會介紹更多其他的方法。
各位可能就會開始想說,好神奇,它居然可以從大量資料裡面 自動萃取出來這種規則,我就知道什麼樣的人會購買什麼樣的商品。
那我們接下來就要介紹說在商業領域裡面怎麼去應用 這些找到的決策規則呢。
舉個例而言, 像剛剛這樣的過程當中,你會發現說我們的消費者,這個是一個保險公司的例子,
我們的消費者在購買各種險種的時候,到底他的 紅利發放方法是現金、
抵繳保費,還是沒有紅利, 好像在這個決策當中其實是沒有影響的。
那到底他的年齡是比較年輕,還是年紀比較大,
好像也在這個決策樹裡面沒有影響,所以它首先第一步它會幫你把決策裡面
比較相關的因素挑出來,比較不相關的因素幫你排除。
所以以這個例子,比較相關的是性別,是婚姻, 是子女數,這三個是比較重要的決策因素。
我們現在這個是簡化的例子,你要想像
我們一般保險公司每個人身上,大概幾乎都有上百個各式各樣的這種描述性的資料欄位,
商品種類裡面也有上百個各式各樣的欄位,所以我們在真的商業世界裡面
是從幾百到幾千個變數裡面去挑出來真的跟決策比較相關的,
所以決策樹在商業上面最大的貢獻,第一個它會幫你按照優先順序
挑出最重要的決策因素,並且排除比較不重要的。
那接下來是說有些欄位裡面, 像比如說子女數,這種資料欄位是一種連續的數值。
那這種連續的數值,我們在決策是說,到底是一個子女,兩個子女,還是三個
子女,我們必須要怎麼做劃分,這個決策樹分析在建模型的時候, 它也會自動幫你去排列、
計算各種組合,挑出一個最佳的適當值。
那以這個例子而言,它就是對應說,發現子女數是以大於 1
跟小於 等於 1 作為一個分界,那他們的購買行為就會發生不一樣,
所以這個就是我們一個商業上面決策模型的描述。
那在下一頁呢,我們要跟各位介紹說那接下來的應用來做什麼,
你已經用你既有的保險資料庫裡面去分析出來,原來
你的保戶資料裡面什麼樣的人都買哪些商品,那我們接下來就可以做兩大類的應用。
第一個是放大,怎麼放大呢?我們如果接下來去拜訪或者去接觸一個陌生的客戶,
到底陌生的客戶我們通常在做行銷的時候,你要去 做一種不論是電話,或者是推銷,或者是廣告,
你不太可能把你的所有的商品攤開來,問說你到底喜歡哪一種, 我們如果想要做一種個人化的推薦,這個時候我們就有很多的決策規則可以用。
舉個例,我們可能就會先詢問我們的客戶說,請問你的子女數是大於 1 或小於
等於 1,然後接下來會問說,他的婚姻狀況跟你的性別,
這樣子我們就可以決定說,他可能會購買 壽險或者是健康險或者是意外險的機率,
哪一個比較大,所以我們就可以做到非常精準的個人化推薦,
這個我們在行銷裡面稱之為是目標行銷或者是精準的行銷。
這個時候呢,我們就可以有一個根據資料分析出來的規則,
去做大規模的開發客戶,這個時候我們也稱之為叫做科學化的行銷。
那這個就是一個非常具體,我們把資料分析 找到的規則、
決策模型 應用在保險業作為行銷跟開發客戶的一個商業的例子。