2019年11月8日 星期五

應用意向大數據分析於銷售

情   境

現下取得產品品項名稱、銷售數量(以X4表示),單價分類與區域,對此四組資料,可以了解特定產品品項在哪些區域賣得比較好,以及在當地銷售的數量和單價如何。

為了回答這樣的問題,我設定了層次順序為 產品品項 → 區域 → 單價分類 → 銷售數量

對唯一的數字資料,分為2組。X4 最小值=1.000000  最大值=507.000000
對單價則分為低單價、中單價、高單價、超高單價
其他文字類型的資料,以文字來分類
<254 .000000="" 127.5000000000="" nbsp="" p="">
資料來源:使用模擬銷售資料,並調整部份數據




分    析    結    果

第一個問題特定產品在哪個區域賣最好呢?想回答這個問題,我們要選擇條件機率的最大值會是比較好的。所以經過意向大數據分析後,得到


家用紙品 估計結果 北部
女性衛生用品 估計結果 北部
嬰兒尿褲 估計結果 北部


無論是哪種產品品項條件下,都是在北部最好販售(出現機率最高)。

既然是在北部最好販售,那麼定價上有什麼特徵呢?


家用紙品 and 北部 估計結果 超高單價
家用紙品 and 中彰投 估計結果 超高單價
家用紙品 and 南部 估計結果 中單價
家用紙品 and 東部 估計結果 中單價
女性衛生用品 and 北部 估計結果 超高單價
女性衛生用品 and 中彰投 估計結果 中單價
女性衛生用品 and 南部 估計結果 低單價
女性衛生用品 and 東部 估計結果 低單價
嬰兒尿褲 and 北部 估計結果 超高單價
嬰兒尿褲 and 中彰投 估計結果 超高單價
嬰兒尿褲 and 南部 估計結果 超高單價
嬰兒尿褲 and 東部 估計結果 中單價


從意向大數據分析的結果中,我挑出產品品項且在北部的定價分類,分別有

由家用紙品         and 北部 估計結果 超高單價
由女性衛生用品 and 北部 估計結果 超高單價
由嬰兒尿褲         and 北部 估計結果 超高單價

所以,我可以發現當這些產品品項在北部販售時,是以超高單價在販售!

最後,在產品品項且區域且單價條件下,到底販售的數量有多少呢?

家用紙品 and 北部 and 高單價 估計結果 X4分類= 127.5
家用紙品 and 北部 and 超高單價 估計結果 X4分類= 127.5
家用紙品 and 北部 and 中單價 估計結果 X4分類= 127.5
家用紙品 and 北部 and 低單價 估計結果 X4分類= 127.5
家用紙品 and 中彰投 and 高單價 估計結果 X4分類= 127.5
家用紙品 and 中彰投 and 超高單價 估計結果 X4分類= 127.5
家用紙品 and 中彰投 and 中單價 估計結果 X4分類= 127.5
家用紙品 and 南部 and 高單價 估計結果 X4分類= 127.5
家用紙品 and 南部 and 超高單價 估計結果 X4分類= 127.5
家用紙品 and 南部 and 中單價 估計結果 X4分類= 127.5
家用紙品 and 南部 and 低單價 估計結果 X4分類= 127.5
家用紙品 and 東部 and 高單價 估計結果 X4分類= 127.5
家用紙品 and 東部 and 超高單價 估計結果 X4分類= 127.5
家用紙品 and 東部 and 中單價 估計結果 X4分類= 127.5
家用紙品 and 東部 and 低單價 估計結果 X4分類= 127.5
女性衛生用品 and 北部 and 高單價 估計結果 X4分類= 127.5
女性衛生用品 and 北部 and 超高單價 估計結果 X4分類= 127.5
女性衛生用品 and 北部 and 中單價 估計結果 X4分類= 127.5
女性衛生用品 and 北部 and 低單價 估計結果 X4分類= 127.5
女性衛生用品 and 中彰投 and 高單價 估計結果 X4分類= 127.5
女性衛生用品 and 中彰投 and 超高單價 估計結果 X4分類= 127.5
女性衛生用品 and 中彰投 and 中單價 估計結果 X4分類= 127.5
女性衛生用品 and 中彰投 and 低單價 估計結果 X4分類= 127.5
女性衛生用品 and 南部 and 高單價 估計結果 X4分類= 127.5
女性衛生用品 and 南部 and 超高單價 估計結果 X4分類= 127.5
女性衛生用品 and 南部 and 中單價 估計結果 X4分類= 127.5
女性衛生用品 and 南部 and 低單價 估計結果 X4分類= 127.5
女性衛生用品 and 東部 and 中單價 估計結果 X4分類= 127.5
女性衛生用品 and 東部 and 低單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 北部 and 高單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 北部 and 超高單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 北部 and 中單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 中彰投 and 高單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 中彰投 and 超高單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 中彰投 and 中單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 南部 and 超高單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 南部 and 中單價 估計結果 X4分類= 127.5
嬰兒尿褲 and 東部 and 中單價 估計結果 X4分類= 127.5


從意向大數據分析結果可以看到一個非常有趣的現象,全部都是落於127.5。當然這可能是我設定的銷售數量分組只有兩組的問題。之後又嘗試分為5組,也一樣都落於最低組中點51.6。


分5組
X4 最小值=1.000000  最大值=507.000000
分類 1 , X4 < 102.200000
<102 .200000="" nbsp="" p="">分類 2, 102.200000 <=X4 < 203.400000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p="">分類 3, 203.400000 <=X4 < 304.600000
<304 .600000="" 254.0000000000="" nbsp="" p="">分類 4, 304.600000 <=X4 < 405.800000
<304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p="">分類 5 , X4 >=405.800000, 組中點=      456.4000000000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p=""><304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p="">


觀察後發現銷售數量非常分散!我選擇不等距的相對次數分配表來進行分析。

X4 的層次可分成5分類,
X4 最小值=1.000000  最大值=507.000000
分類 1 , X4 < 5.000000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p=""><304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p=""><5 .000000="" p="">分類 2, 5.000000 <=X4 < 20.000000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p=""><304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p=""><5 .000000="" p=""><20 .000000="" p="">分類 3, 20.000000 <=X4 < 60.000000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p=""><304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p=""><5 .000000="" p=""><20 .000000="" p=""><60 .000000="" p="">分類 4, 60.000000 <=X4 < 100.000000
<102 .200000="" nbsp="" p=""><203 .400000="" 152.8000000000="" nbsp="" p=""><304 .600000="" 254.0000000000="" nbsp="" p=""><405 .800000="" 355.2000000000="" nbsp="" p=""><5 .000000="" p=""><20 .000000="" p=""><60 .000000="" p=""><100 .000000="" p="">分類 5 , X4 >=100.000000


分組是我自己認定的,所以經過意向大數據分析後,得到

家用紙品 and 北部 and 高單價 估計結果 X4分類= 5
家用紙品 and 北部 and 超高單價 估計結果 X4分類= 2
家用紙品 and 北部 and 中單價 估計結果 X4分類= 2
家用紙品 and 北部 and 低單價 估計結果 X4分類= 2
家用紙品 and 中彰投 and 高單價 估計結果 X4分類= 3
家用紙品 and 中彰投 and 超高單價 估計結果 X4分類= 1
家用紙品 and 中彰投 and 中單價 估計結果 X4分類= 2
家用紙品 and 南部 and 高單價 估計結果 X4分類= 2
家用紙品 and 南部 and 超高單價 估計結果 X4分類= 1
家用紙品 and 南部 and 中單價 估計結果 X4分類= 2
家用紙品 and 南部 and 低單價 估計結果 X4分類= 2
家用紙品 and 東部 and 高單價 估計結果 X4分類= 1
家用紙品 and 東部 and 超高單價 估計結果 X4分類= 1
家用紙品 and 東部 and 中單價 估計結果 X4分類= 1
家用紙品 and 東部 and 低單價 估計結果 X4分類= 3
女性衛生用品 and 北部 and 高單價 估計結果 X4分類= 2
女性衛生用品 and 北部 and 超高單價 估計結果 X4分類= 2
女性衛生用品 and 北部 and 中單價 估計結果 X4分類= 3
女性衛生用品 and 北部 and 低單價 估計結果 X4分類= 3
女性衛生用品 and 中彰投 and 高單價 估計結果 X4分類= 2
女性衛生用品 and 中彰投 and 超高單價 估計結果 X4分類= 2
女性衛生用品 and 中彰投 and 中單價 估計結果 X4分類= 3
女性衛生用品 and 中彰投 and 低單價 估計結果 X4分類= 2
女性衛生用品 and 南部 and 高單價 估計結果 X4分類= 1
女性衛生用品 and 南部 and 超高單價 估計結果 X4分類= 2
女性衛生用品 and 南部 and 中單價 估計結果 X4分類= 3
女性衛生用品 and 南部 and 低單價 估計結果 X4分類= 3
女性衛生用品 and 東部 and 中單價 估計結果 X4分類= 2
女性衛生用品 and 東部 and 低單價 估計結果 X4分類= 3
嬰兒尿褲 and 北部 and 高單價 估計結果 X4分類= 2
嬰兒尿褲 and 北部 and 超高單價 估計結果 X4分類= 2
嬰兒尿褲 and 北部 and 中單價 估計結果 X4分類= 2
嬰兒尿褲 and 中彰投 and 高單價 估計結果 X4分類= 2
嬰兒尿褲 and 中彰投 and 超高單價 估計結果 X4分類= 2
嬰兒尿褲 and 中彰投 and 中單價 估計結果 X4分類= 2
嬰兒尿褲 and 南部 and 超高單價 估計結果 X4分類= 1
嬰兒尿褲 and 南部 and 中單價 估計結果 X4分類= 2
嬰兒尿褲 and 東部 and 中單價 估計結果 X4分類= 2

原來在產品品項、在北部販售超高單價的數量落於分類2,也就是販售數量介於 5.000000至20.000000。


那麼以貝氏定理將問題反過來看,我一樣用不等距相對次數分配表的結果來看,由於問題得到的是銷售數量為分類2,所以貝氏定理下,我一樣找到分類2,得到對應的價格為超高單價!

X4分類= 1 估計結果 超高單價
X4分類= 2 估計結果 超高單價
X4分類= 3 估計結果 超高單價
X4分類= 4 估計結果 低單價
X4分類= 5 估計結果 高單價

在銷售數量為分類2且販售超高單價的條件下,這是販售在哪裡呢?答案是北部
到目前為止貝氏定理的路徑確實是前述問題的路徑。

X4分類= 1 and 高單價 估計結果 北部
X4分類= 1 and 超高單價 估計結果 北部
X4分類= 1 and 中單價 估計結果 北部
X4分類= 1 and 低單價 估計結果 東部
X4分類= 2 and 高單價 估計結果 北部
X4分類= 2 and 超高單價 估計結果 北部
X4分類= 2 and 中單價 估計結果 北部
X4分類= 2 and 低單價 估計結果 北部
X4分類= 3 and 高單價 估計結果 北部
X4分類= 3 and 超高單價 估計結果 北部
X4分類= 3 and 中單價 估計結果 北部
X4分類= 3 and 低單價 估計結果 北部
X4分類= 4 and 高單價 估計結果 北部
X4分類= 4 and 超高單價 估計結果 北部
X4分類= 4 and 中單價 估計結果 北部
X4分類= 4 and 低單價 估計結果 北部
X4分類= 5 and 高單價 估計結果 北部
X4分類= 5 and 超高單價 估計結果 北部
X4分類= 5 and 中單價 估計結果 北部
X4分類= 5 and 低單價 估計結果 北部


最後,由銷售數量為分類2、超高單價且銷售在北部的條件下,倒底是賣什麼呢?答案是有最高機率是賣女性衛生用品

X4分類= 1 and 高單價 and 北部 估計結果 女性衛生用品
X4分類= 1 and 高單價 and 中彰投 估計結果 女性衛生用品
X4分類= 1 and 高單價 and 南部 估計結果 女性衛生用品
X4分類= 1 and 高單價 and 東部 估計結果 家用紙品
X4分類= 1 and 超高單價 and 北部 估計結果 家用紙品
X4分類= 1 and 超高單價 and 中彰投 估計結果 家用紙品
X4分類= 1 and 超高單價 and 南部 估計結果 家用紙品
X4分類= 1 and 超高單價 and 東部 估計結果 家用紙品
X4分類= 1 and 中單價 and 北部 估計結果 家用紙品
X4分類= 1 and 中單價 and 中彰投 估計結果 家用紙品
X4分類= 1 and 中單價 and 南部 估計結果 家用紙品
X4分類= 1 and 中單價 and 東部 估計結果 家用紙品
X4分類= 1 and 低單價 and 東部 估計結果 女性衛生用品
X4分類= 2 and 高單價 and 北部 估計結果 女性衛生用品
X4分類= 2 and 高單價 and 中彰投 估計結果 女性衛生用品
X4分類= 2 and 高單價 and 南部 估計結果 家用紙品
X4分類= 2 and 高單價 and 東部 估計結果 家用紙品
X4分類= 2 and 超高單價 and 北部 估計結果 女性衛生用品
X4分類= 2 and 超高單價 and 中彰投 估計結果 嬰兒尿褲
X4分類= 2 and 超高單價 and 南部 估計結果 嬰兒尿褲
X4分類= 2 and 超高單價 and 東部 估計結果 家用紙品
X4分類= 2 and 中單價 and 北部 估計結果 家用紙品
X4分類= 2 and 中單價 and 中彰投 估計結果 家用紙品
X4分類= 2 and 中單價 and 南部 估計結果 家用紙品
X4分類= 2 and 中單價 and 東部 估計結果 家用紙品
X4分類= 2 and 低單價 and 北部 估計結果 女性衛生用品
X4分類= 2 and 低單價 and 中彰投 估計結果 女性衛生用品
X4分類= 2 and 低單價 and 南部 估計結果 女性衛生用品
X4分類= 2 and 低單價 and 東部 估計結果 女性衛生用品
X4分類= 3 and 高單價 and 北部 估計結果 家用紙品
X4分類= 3 and 高單價 and 中彰投 估計結果 家用紙品
X4分類= 3 and 高單價 and 南部 估計結果 家用紙品
X4分類= 3 and 超高單價 and 北部 估計結果 女性衛生用品
X4分類= 3 and 超高單價 and 中彰投 估計結果 家用紙品
X4分類= 3 and 超高單價 and 南部 估計結果 家用紙品
X4分類= 3 and 超高單價 and 東部 估計結果 家用紙品
X4分類= 3 and 中單價 and 北部 估計結果 家用紙品
X4分類= 3 and 中單價 and 中彰投 估計結果 女性衛生用品
X4分類= 3 and 中單價 and 南部 估計結果 女性衛生用品
X4分類= 3 and 低單價 and 北部 估計結果 女性衛生用品
X4分類= 3 and 低單價 and 中彰投 估計結果 女性衛生用品
X4分類= 3 and 低單價 and 南部 估計結果 女性衛生用品
X4分類= 3 and 低單價 and 東部 估計結果 女性衛生用品
X4分類= 4 and 高單價 and 北部 估計結果 家用紙品
X4分類= 4 and 高單價 and 中彰投 估計結果 家用紙品
X4分類= 4 and 高單價 and 南部 估計結果 家用紙品
X4分類= 4 and 超高單價 and 北部 估計結果 家用紙品
X4分類= 4 and 超高單價 and 中彰投 估計結果 家用紙品
X4分類= 4 and 超高單價 and 南部 估計結果 家用紙品
X4分類= 4 and 超高單價 and 東部 估計結果 家用紙品
X4分類= 4 and 中單價 and 北部 估計結果 女性衛生用品
X4分類= 4 and 中單價 and 中彰投 估計結果 女性衛生用品
X4分類= 4 and 中單價 and 南部 估計結果 家用紙品
X4分類= 4 and 低單價 and 北部 估計結果 女性衛生用品
X4分類= 4 and 低單價 and 中彰投 估計結果 女性衛生用品
X4分類= 4 and 低單價 and 南部 估計結果 女性衛生用品
X4分類= 5 and 高單價 and 北部 估計結果 家用紙品
X4分類= 5 and 高單價 and 中彰投 估計結果 家用紙品
X4分類= 5 and 高單價 and 南部 估計結果 家用紙品
X4分類= 5 and 超高單價 and 北部 估計結果 家用紙品
X4分類= 5 and 中單價 and 北部 估計結果 女性衛生用品
X4分類= 5 and 中單價 and 東部 估計結果 家用紙品
X4分類= 5 and 低單價 and 北部 估計結果 女性衛生用品
X4分類= 5 and 低單價 and 南部 估計結果 女性衛生用品


#########################################################################

結    論


在分析過程中,產品品項 → 區域 → 單價分類 → 銷售數量在前三層次的估計結果都是相同的,無論銷售數量的分類如何。所以我就可以繼續使用相同的結果。既然我也想反過來分析,那就以原本問題得到的結果,再反推回去,於是可歸納出下面的情況。


所以,產品品項 → 區域 → 單價分類 → 銷售數量 最常發生的為

三種產品品項最常販賣於北部,以超高單價銷售,售出分類2的數量。

反過來分析, 銷售數量 → 單價分類 → 區域 → 產品品項,最常發生的為

銷售數量如果是分類2,常以超高單價賣出到北部,產品常見的是女性衛生用品。

意向大數據分析非常容易上手使用,而且分析時可以得到對照表,讓使用者對照出結果。另外,無論是正推論還是反推論,都非常容易且方便地推論出結果。