啤酒尿布問題
2024/09/02
在機器學習領域裡面,我們常常會根據輸入的資料是否有相對應的標注,將問題分成監督式學習(supervised learning)或者是非監督式學習(unsupervised learning)。而在非監督式學習裡面,有一個種類的學習應用場景非常的特殊,它能夠幫助我們尋找資料之間隱藏的規則,協助我們去做商業決策,這就是我們今天想來談談的主題─關聯規則學習(association rule learning)
所謂的關聯規則學習,目的就是要探勘出大量資料裡,哪些變量之間是有關聯性的,並找出資料之間的規則以及商業知識。由於這種學習方法常常被零售商拿來做商品銷售之分析,所以又被稱為購物籃分析(market basket analysis),常見此類型的演算法有Apriori以及FP-growth。
購物籃分析最經典且著名的例子莫過於零售商沃爾瑪(Wal-mart)的案例了。沃爾瑪於1990年代時,內部的資訊工程師在分析銷售數據的時候,意外的發現”星期五晚上”、”啤酒”、”尿布”的銷售有正相關性,得知這樣訊息的沃爾瑪,便決定在每個星期五將啤酒以及尿布放在同一個區域,而這也意外地提升了30%兩項商品之銷售量。
那麼到底他們是怎麼樣解讀這樣一個現象呢?後來經過許多調查才發現,原來週五的晚上,許多家庭的父親會到超市買尿布,順便也會為了週末的球賽購買啤酒,所以才造成兩項商品間顯著之相關性。
最後想要補充的是,關聯性分析除了可以應用在零售業外,一般像是推荐系統、金融數據分析等也常常被拿來做使用,如何從眾多資訊當中分析出有意義的價值,並做對的決策,是大數據時代裡,每個公司不可忽視的能力之一阿。