You are on page 1of 88

Data Mining 的企業應用範

疇與方法論 ---SQL
Server 2005
謝邦昌
輔仁大學統計資訊學系 教授
中華資料採礦協會   理事長
stat1001@mails.fju.edu.tw
WWW.CDMS.ORG.TW

08/21/09 1
你不能不知的十大創新技術

Technology Review 雜誌(麻省理工學院 2002 年 1 月出


08/21/09 2
刊)
改變未來的十大創新技術
• 機器與人腦的介面
• 塑膠電晶體
• 資料採礦 (Data mining)
• 數字權利管理
• 生物測定學 (Biometrics)
• 語言識別處理
• 微光學技術 (Microphotonics)
• 解開程式碼 (Untangling code)
• 機器人設計
• 微應用流體學 (Microfluidics)
08/21/09 3
知識發現
• The nontrivial process of identifying
valid 、 novel 、 potentially useful, and
ultimately understandable pattern in data
–Fayyad,1996

資料來源: Fayyad et al.


( 1996 )
08/21/09 4
Data Mining 進行步驟
• 理解資料與進行的工作
• 獲取相關知識與技術
• 融合與查核資料
• 去除錯誤或不一致的資料
• 發展模式與假設
• 實際資料採礦工作
• 測試與檢核所挖掘的資料
• 解釋與使用資料

08/21/09 5
Data Mining 評估
Database Theory Artificial Intelligence

Data Warehousing Statistics Machine Learning

Data Mining

08/21/09 6
Data Mining 的應用

Customer Life Cycle Acquisition:


Not customer Customer profiling
Target marketing
Churn Segmentation
Market basket
analysis
•Cross-selling
Matured Customer

New Customer

Maintenance (II):
Customer Loyalty &
Retention Maintenance (I):
Life-time Value Cross-selling
Profitability Segmentation
Risk Management
08/21/09 7
Data Mining 工具
• 資料採礦工具是利用資料來建立一些模擬真實世
界的模式( Model ),利用這些模式來描述資料
中的特徵( Patterns )以及關係( Relations )。
這些模式有兩種用處:
– 瞭解資料的特徵與關係可以提供你做決策所需要的資
訊。
– 資料的特徵可以幫助你做預測。

08/21/09 8
• 資料採礦可以建立六種模式:
– Classification
– Regression
– Time Series
– Clustering
– Association
– Sequence

08/21/09 9
Data Mining 的商業價值
Business Knowledge
SQL Server 2005

Data Mining


OLAP


Reports ( 動態 & Ad hoc)

Reports ( 靜態 )

Easy Difficult
使用容易度
• 5 個新的 algorithms • 與現有 BI 系統整合
• 親切的使用者介面 • 與 Web & Office
08/21/09 10
• 12 種 viewer 整合 資料來源 :Microsoft Taiwan
資料來源 :Microsoft

完整與強大的演算法
Taiwan

Decision Trees Clustering Time Series

Sequence Clustering Association Naïve Bayes

08/21/09 11
Logistic Regression Neural Net Linear Regression
如何使用 DMX 建立預測模型
Define a model:
CREATE MINING MODEL

Data Mining
Train a model: Management System
INSERT INTO dmm (DMMS)

Training Data

Prediction using a model: Mining Model


SELECT
FROM dmm PREDICTION
JOIN Prediction Input Data

08/21/09 12
資料來源 :Microsoft Taiwan
Data Mining 模型預測
• 等於 T-SQL 中的 JOIN 語法
• 將資料採礦模型與輸入資料兩者連結在一起
• 語法
– SELECT <select-list>
– FROM dmm
– PREDICTION JOIN <input>
– ON <binding>
– WHERE <where-clause>

08/21/09 13
資料來源 :Microsoft Taiwan
DMX 查詢
• 預測函數 • 統計函數
– PredictProbability – 機率
– PredictTimeSeries – 標準差
– PedictAssociation – 變異數
– RedictSequence • 查詢模型內容
– Cluster • 查詢模型 PMML 文件
• 巢狀查詢函數 • 模型鑽研
– PredictHistogram
• 修改模型內容
• 篩選函數
– TopCount
– TopSum
– TopPercent
08/21/09 14
資料來源 :Microsoft Taiwan
SQL 2005 支援巢狀查詢結果

08/21/09 15
資料來源 :Microsoft Taiwan
DMX 延伸
• 支援 VBA/EXCEL 函數
– 可支援各種已知函數
• 字串 , 數學 , 統計 , 財務 , 工程 , 時間日期等
• 延伸演算法
– 透過 plug-in API
• 使用者定義函數 UDF (User-defined
function)
• 可以與 MDX 整合進行 OLAP 預測

08/21/09 16
資料來源 :Microsoft Taiwan
Text Mining
• 有 90% 地資訊以非結構性文件儲存
• Text Mining 主要是用來處理這些非結構化資訊,
以找出規則與結構
• 可應用在專利文件、病例、論文研究、文件分類、
知識管理、信用評等
• 市場上工具:
– SQL 2005 SSIS/ AS
– IBM Intelligent Miner for Text
– SAS Enterprise Miner for Text
– SPSS Clementine for Text
08/21/09 17
資料來源 :Microsoft Taiwan
新增文字資料採礦功能
• Term Extract, Term Lookup
– 目前僅支援英語
– 可擷取單字或是片語
– 可列舉排除關鍵字
• Fuzzy lookup, Fuzzy Grouping
– 容錯指標 Error-Tolerant Index
• 可應用在專利文件、病例、論文研究、文件分類、
知識管理、信用評等

08/21/09 18
資料來源 :Microsoft Taiwan
文字資料採礦流程
Preproce
ss
Task Definition
Data And Goal Knowledge
Document

LanguageClustering/
Data Extracting Selection Categorization Mining
Feature
Gathering
Extraction
Cleansing Document Preprocessed Text Knowledge Visualization
Repository Data Lexical Database Based
Data Analysis
Transferring
Semantic
Organizing Evaluation
Browsing
Data Loading
Semantic
Analysis

Data

08/21/09 19
Database Tools
SQL Server 2005 Data
Mining 的企業應用範疇與方法

-- 實際應用

08/21/09 20
Data Mining 在各產業的應用
• 金融服務業
客戶貢獻度分析、信用評分、風險評估、客戶區隔、交
叉行銷等。
• 保險業
顧客貢獻度分析、信用評分、風險評估、客戶區隔、交
叉行銷、客戶流失分析和詐欺偵測等。
• 電信業
顧客貢獻度分析、信用評分、客戶區隔、交叉行銷、客
戶流失分析、銷售預測和詐欺偵測等。

08/21/09 21
Data Mining 在各產業的應用
• 製造業
客戶貢獻度分析、品質管制、行銷績效分析、生產分析
和存貨分析等。
• 零售業
客戶忠誠度、客戶區隔、購物籃分析、定價分析、交
叉行銷和銷售預測等。
• 生物科技、醫療保健、航太空業、環境、
法律等

08/21/09 22
商業智慧流程
¸ ê® ÂÆ à́ «ª º¤ ü ã ¸ ®ê Æ
· ½
E x tra c t D a ta S o u rc e
T ra n s fo rm
Load
¸ ê® ºÆ Þ² zª Ì
¸ ê® Æ
­ ÜÀ x/¸ ê® Æ
¥ «¶ °
M IS

M e ta d a ta

T e m p la t e s

´ ­y z̧ ê® ªÆ º̧ ê® Æ
M e ta D a ta ¨ ¥Ï Ϊ Ì
D e c is io n M a k in g
¸ ®ê Ƥ Àª R CRM
D a ta M in in g M a r k e tin g C a m p a ig n
O LAP
08/21/09 23
商業智慧的核心

• 如何收集資料
 營運資料,市場調查資料,固定 Panel 追蹤
• 如何管理資料
 ETL , Data warehousing
• 如何從資料中獲取智慧
 Data Mining , OLAP , Statistics
• 如何應用智慧
 行銷策略,主管決策,互動化 CRM 機制

08/21/09 24
電信業潛在客戶發掘

08/21/09 25
研究動機
由於電信業市場蓬勃發展,在台灣
的電信自由化風潮下,產業的開放帶動了台
灣電信產業的成長,在如此自由化的 動之
下衍生出的廣大商機成為了全台灣的焦點,
也因此電信產業的特性與行銷策略的制定跟
著成為大家所關注的議題。

08/21/09 26
研究目的
本研究利用 Data mining 技術結合
統計抽樣方法,以集群分析、 Logistic
Regression 、決策樹等統計相關分析方法來
為電信業帶來更深入的資訊 ,利用有手機顧
客群之滿意度及忠誠度項目進行分群,來發
掘無手機顧客群中的潛在顧客

08/21/09 27
研究架構圖 模型判斷不恰當

析素主
連 、分成
續 迴析分
資 歸、分
料 樹集析
分群、
收 析分因
集 利 找
相 資 用
研 料 出
關 資 判 各 決
究 資 淨 資 別
主 化 料 檢 群 策
料 料 型 分 驗 特 人
題 、 、 抽 析
之 處 態 模 性 員
資 樣 判 建 型
建 訊 理 立
立 斷 分迴集
及 判 模
技 析歸群 別 型 相
術 分分 模 判 關
析析 型 斷 專
離 、、 業
散 正
分羅 確 領
資 類吉 域
料 樹斯 知
08/21/09 28

研究方法
• 集群分析 (Cluster Analysis)
– 集群分析法是一種劃分方法,目的在將一些事
物歸併在一起,利用群體中各事物都具有相同
的特性,而在群體與群體之間卻有顯著的差異

08/21/09 29
研究方法
• Logistic Regression
就是針對二元因變數 ,即是 1 或 0 。在
Logistic Curve 中有一個臨界遞增的 S 型
函數,適用於分析一機率模型,而根據分類性變
數,產生輸出變數,其 為 可 0 或 1 ,常代表
選擇量度中的「是」與「否」兩類。

08/21/09 30
• 羅吉斯迴歸在統計的運用上相當普遍,不
但在二元化的離散資型資料中使用率高,
尤其在醫學方面的使用更為廣泛。
• 在羅吉斯分布下,不但可運用在單變量迴
歸模型,亦可推廣至多變量迴歸模型,

08/21/09 31
• 單變量羅吉斯迴歸
– 假設 π(x) = E(y|x), 則模型表示如下

– 若將 π(x) 做羅吉斯轉換,可得下列表示式

08/21/09 32
研究方法
• CHAID 決策樹
– 決策樹是從一個或多個預測變數中,針對類別
應變數的階級,預測案例或物件的關係;分類
樹的目標是針對類別應變數加以預測或解釋反
應結果。

08/21/09 33
研究流程圖
模型判斷不恰當


用 提
利 判 根
之 比 一 用 據 供
別 檢母 給
間 較 樣 決 分 特
樣 結 母 致 本 性 驗體 系
定 析 統
顧 構 體 最 做 抽代
客 資 進 找 廠
料 是 與 行 佳 建 樣入
資 出 樣模 商
抽 否 樣 集 分 判 議
料 一 本 本型 做
群 群 別 決
致 分 ,
模 策
析 型

兩者結構不一致

08/21/09 34
將資 料庫 輸入 用 SQL Server
Management Studio 為介面 輸
入各 類型 資料

08/21/09 35
將資料分為 Training Data 及 Testing
Data 用 SQL Server Integration
Services 及 Virual Studio 來執行
08/21/09 36
進行 Data Mining

08/21/09 37
08/21/09 38
9 種 Data Mining 模

08/21/09 39
選取 資料 變

08/21/09 40
Data Mining 方法命

08/21/09 41
Data Mining 結構 完成

08/21/09 42
採礦模 型檢視器

Cluster

Vabiable1
1
2
Vabiable1
3
4
5

Vabiable2
Vabiable1
Vabiable3
Vabiable2
Vabiable3
Vabiable2

Vabiable1

Vabiable1
08/21/09 43
採礦模 型檢視器
檢視 Cluster 的比 例及 其條 件式

Vabiable1

Vabiable1

Vabiable2

滑鼠右鍵 Vabiable2
Vabiable1

Vabiable3
觀察屬 於該 節點之 觀測 值 Vabiable2

Vabiable1=1
Vabiable2 Cluster Vabiable3 Vabiable4 Vabiable5 Vabiable1 Vabiable6
Vabiable1

Vabiable1
08/21/09 44
採礦模 型檢視器

職業 =1, 年齡 =2, 籍貫 =1

•此節點中
集群 1=1 的比例有 59.59%
集群 1=0 的比例有 40.40%
•其特性為
職業 =1
年齡 =2
08/21/09 籍貫 =1 45
模型相 依性網路

性別
各 教育程度
變 弱

與 自變數

測 各群

年齡

職業

的 預測變數

聯 籍貫

08/21/09 46
職業
性別
年齡
籍貫
戶籍
男 教育程度

比例表現,
其數字表示
最大之比例

08/21/09 47
群集 圖表

在群集 2 中,則
無” 0-1
Miles” 的資料

在群集 3 中 ” 0-1
Miles” 的比例最高,有
74%

08/21/09 48
群集 設定檔

value1
value2
value3
value4
value5
missing
說明:
了解各群集中,各變數的分佈比例,以圖
中為例,群集 2 中,距離為” value1” 的
有 0.4% 、 ” value2” 的有 25.7% 、 ”
value3” 的有 13.6% 、 ” value4” 的有
08/21/09 32% 、 ” value5” 的有 28.3% 49
群集特 性

說明:
針對各群集中,所有
自變數之各選項,其
分佈機率值,可看其
Variables 各群集中,各變數主
要分佈比例情形

08/21/09 50
群集辨 識

說明:
群集間兩兩比較,了解各變數其值
在兩群間之比重分數,以圖中為例
, Age 在 47.7~95 之間者,在群集
2 中的得分為 100 ,而 24~47.7 在
群集 1 中的分數為 100

08/21/09 51
研究方法
• 抽樣
– 由母體抽出 0.5% 的樣本
– 由基本資料檢驗母體與樣本結構的相似性

08/21/09 52
母體樣本結構比較—性別

56.00% 54.12%
53.20%
54.00%

52.00%

50.00%
46.80%
48.00% 45.89%

46.00%

44.00%

42.00%

40.00%
男 女

樣本 母體

08/21/09 53
母體樣本結構比較—年齡
25.00%

20.00%

15.00% 22.34 22.37


17.97 17.66 19.32 18.58
18.23 19.37

10.00%
11.84 11.53
10.30 10.49

5.00%

0.00%
20歲以下 20-29歲 30-39歲 40-49歲 50-59歲 60以上

樣本 母體
08/21/09 54
母體樣本結構比較—教育程度

45.00% 41.24%40.41%

40.00%
35.00% 31.58%32.64%
27.18%26.95%
30.00%
25.00%
20.00%
15.00%
10.00%
5.00%
0.00%
國中及以下 高中高職 大專及以上

樣本 母體

08/21/09 55
母體樣本結構比較—籍貫
80.00%
78.22% 77.78%
70.00%

60.00%

50.00%

40.00%

30.00%

20.00%
9.52% 10.40% 10.30% 9.92%
10.00% 1.96% 1.90%

0.00%
客家 本省閩南 外省籍 原住民

樣本 母體

08/21/09 56
母體樣本結構比較—職業
30.00%

25.00% 25.40 26.64

20.00%
18.28 17.66
15.00%
12.82 13.41 13.42
13.69 14.35
10.00%
5.12 7.73
12.14 8.34
5.00%
5.40 0.37 2.58
0.34 2.32

0.00%
學生 家庭 軍公教 民營 專業 勞力 自營商 失業 其他
主婦 企業 技術 工作者 退休
白領 人員
上班族

08/21/09 57
樣本 母體
母體樣本結構比較—戶籍(北)
12.00%
11.65% 11.42%
10.00%
8.01%
8.00% 8.38%

6.50% 6.86%
6.00%

4.00%
2.82% 2.17% 2.76%
2.86%
1.24% 1.03% 2.44% 2.44%
2.00%
1.29% 0.76%
0.00%
台北市 基隆市 新竹市 台北縣 宜蘭縣 桃園縣 新竹縣 苗栗縣

08/21/09 樣本 母體 58
母體樣本結構比較—戶籍(中)
8.00%
7.87% 7.99%
7.00%

6.00% 6.08% 6.37%

5.00%
4.90% 5.79%
4.00%
4.12% 3.51%
3.00%
2.77% 2.84%
2.00%

1.00%

0.00%
台中市 台中縣 彰化縣 南投縣 雲林縣

樣本 母體
08/21/09 59
母體樣本結構比較—戶籍(南)
9.00%

8.00% 8.48% 7.98%


7.00%
7.25% 6.36%
6.00%
6.19% 5.62%
5.00%

4.00% 4.76% 4.27%


3.95% 4.28%

3.00%

2.00%

1.00%

0.00%
高雄市 嘉義縣 台南縣 高雄縣 屏東縣

樣本 母體

08/21/09 60
母體樣本結構比較—戶籍(東、澎)
1.71%
1.80%
1.56%
1.60% 1.41%
1.29%
1.40%

1.20%

1.00%

0.80%

0.60%

0.40% 0.22% 0.20%

0.20%

0.00%
台東縣 花蓮縣 澎湖縣

樣本 母體

08/21/09 61
步驟 一、 K­means 集群分 析法找 出最 佳集群 數

F值 三群 四群 五群 六群 七群 八群
清晰滿意 111.801 45.413 70.408 67.826 61.356 56.862
付費合理 94.828 56.357 71.916 68.875 78.983 62.052
服務效率 122.101 212.466 187.742 170.479 179.111 122.012
服務人員 161.522 252.438 238.219 194.914 160.409 148.782
整體服務 164.152 142.466 181.745 155.755 137.811 112.530
更換系統 5.918 5.228 3.848 7.156 4.949 5.124
手機品牌 3910.058 2550.775 1951.107 2825.233 1715.410 1484.845
更換手機 5.144 1.928 1.622 6.138 3.342 7.986
手機外型 102.354 47.872 73.517 65.956 58.504 47.268
手機功能 162.667 17.568 103.174 56.036 72.058 74.160
手機整體 195.884 31.362 155.297 83.205 112.220 128.002
電磁波 90.124 562.990 305.317 237.374 237.767 309.723

08/21/09 62
步驟二、 判別 分析計 算分群 正確 率

Percen
正確率 集群一 集群二 集群三 集群四 集群五
t

集群一 100.00 200 0 0 0 0

集群二 97.93 0 284 4 2 0

集群三 91.42 0 11 213 9 0

集群四 99.78 0 0 1 462 0

集群五 98.50 0 0 0 2 131

Total 97.80 200 295 218 475 131

08/21/09 63
步驟三、 針對 各群特 色加 以命名

  引領風潮者 流行擁護者 健康主義者 中庸型顧客 挑剔型顧客

清晰滿意 滿意 非常滿意 滿意 滿意 非常不滿意

付費合理 滿意 非常滿意 滿意 滿意 非常不滿意

服務效率 非常滿意 非常滿意 滿意 滿意 非常不滿意

服務人員 滿意 非常滿意 滿意 滿意 非常不滿意

整體服務 滿意 非常滿意 滿意 滿意 非常不滿意


摩托羅拉、
摩托羅拉、易 摩托羅拉、易 摩托羅拉、易
手機品牌 其他品牌 易利信、諾
利信、諾基亞 利信、諾基亞 利信、諾基亞
基亞
手機外型 非常滿意 非常滿意 滿意 滿意 普通

手機功能 滿意 非常滿意 滿意 滿意 滿意

手機整體 普通 非常滿意 普通 普通 滿意

電磁波 不太擔心 一點不擔心 有點擔心 有點擔心 非常擔心


08/21/09 64
交叉分析
性別 引領風潮 流行擁護 健康主義 中庸型 挑剔型 總計
男 105 179 133 231 95 743
  52.50% 61.72% 57.08% 49.89% 71.43%  
女 95 111 100 232 38 576
  47.50% 38.28% 42.92% 50.11% 28.57%  
總計 200 290 233 463 133 1319

在這 五群 中潛在 顧客 大都
集中 在男 生,其 中只 有中
庸型 顧客 群是集 中在 女生
的比 例較 多。

08/21/09 65
交叉分析
年齡 引領風潮 流行擁護 健康主義 中庸型 挑剔型 總計
20 歲以下 13 18 34 36 9 110
  6.50% 6.21% 14.59% 7.78% 6.77%  
20-29 歲 80 85 77 142 42 426
  40.00% 29.31% 33.05% 30.67% 31.58%  
30-39 歲 64 115 61 149 44 433
  32.00% 39.66% 26.18% 32.18% 33.08%  
40-49 歲 38 52 42 109 33 274
  19.00% 17.93% 18.03% 23.54% 24.81%  
50-59 歲 4  20­29 13
16 25 潮者、
歲:引 領風 3 健康 61
  2.00% 5.52% 主義
5.58% 5.40% 2.26%  
者。
60 以上 1 4 30­39 歲:流
6 2
行擁 護者、 2
中庸 15
  0.50% 1.38% 2.58% 0.43% 1.50%  
型顧 客、 挑剔型 顧客 。
總計 200 290 233 463 133 1319
08/21/09 66
交叉分析
教育程度 引領風潮 流行擁護 健康主義 中庸型 挑剔型 總計
國中及以下 20 48 50 49 13 180
  10.00% 16.55% 21.46% 10.58% 9.77%  
高中高職 57 122 98 186 41 504
  28.50% 42.07% 42.06% 40.17% 30.83%  
大專及以上 123 120 85 228 79 635
  61.50% 41.38% 36.48% 49.24% 59.40%  
總計 200 290 233 463 133 1319

 教育 程度 為高中 高職 程度: 流
行擁 護者 、健康 主義 者。
 教育 程度 為大專 及以 上程度 :
引領 風潮 者、中 庸型 顧客、 挑
剔型 顧客 。
08/21/09 67
交叉分析
籍貫 引領風潮 流行擁護 健康主義 中庸型 挑剔型 總計
客家 35 24 12 44 22 137
  17.50% 8.28% 5.15% 9.50% 16.54%  
本省閩南 151 236 186 331 91 995
  75.50% 81.38% 79.83% 71.49% 68.42%  
外省籍 13 30 35 79 15 172
  6.50% 10.34% 15.02% 17.06% 11.28%  
原住民 1 0 0 9 5 15
  0.50% 0.00% 0.00% 1.94% 3.76%  
總計 200 290 233 463 133 1319

各集群在 籍貫 上的分 佈都集


中在本省 閩南 的人為 主。
08/21/09 68
交叉分析
職業 引領風潮 流行擁護 健康主義 職業 的分 群中以
中庸型 挑剔型 在
總計
學生 24 15 民營 企業
44 43 之白領 7 階 133
  12.00% 5.17% 18.88% 9.29% 5.26%  
家庭主婦 14 24 級及
22 勞力 53 工作者 2 為 115
  7.00% 8.28% 主 11.45%
9.44% 1.50%  
軍公教 17 18 16 62 10 123
  8.50% 6.21% 6.87% 13.39% 7.52%  
民營企業白領上班族 64 81 41 110 38 334
  32.00% 27.93% 17.60% 23.76% 28.57%  
專業技術人員 0 0 0 3 7 10
  0.00% 0.00% 0.00% 0.65% 5.26%  
勞力工作者 51 102 75 77 37 342
  25.50% 35.17% 32.19% 16.63% 27.82%  
自營商 24 32 29 84 19 188
  12.00% 11.03% 12.45% 18.14% 14.29%  
失業退休
 職業為民營企業
5 7 白領階級 4 者:引領24 風潮者、中2 42
  庸型顧客、挑剔
2.50% 2.41% 型顧客。
1.72% 5.18% 1.50%  
其他  職業為勞力工作
1 11 2 7 11 32
者:流行 擁護者、 健康主義者
  0.50% 3.79% 0.86% 1.51% 8.27%  
總計
。 200 290 233 463 133 1319
08/21/09 69
交叉分析
戶籍 引領風潮 流行擁護 健康主義 中庸型 挑剔型 總計
北部地區 86 130 79 209 70 574
  43.00% 44.83% 33.91% 45.14% 52.63%  
中部地區 54 50 65 111 21 301
  27.00% 17.24% 27.90% 23.97% 15.79%  
南部地區 59  107 78
本研究 將各縣市分 137
為北、中、南 38 、東四419
  29.50% 36.90%
區。 33.48% 29.59% 28.57%  
東部地區 1  北部為
3 11
台北市、基 6
隆市、新竹市 4 、台北 25
  0.50% 縣、宜 4.72%
1.03% 蘭縣、桃園 縣、新竹縣、
1.30% 3.01% 苗栗縣
 
總計 200 。
290 233 463 133 1319
 中部為 台中市、台 中縣、彰化縣 、南投
縣、雲 林縣。
 南部為 高雄市、嘉 義市、台南市 、嘉義
縣、台 南縣、高雄 縣、屏東縣、 澎湖縣
08/21/09 。 70
 東部為 台東縣、花 蓮縣。
分群後的結果與建議
• 透過分群模式,針對已分 • 本研究將各群針對特性加
群樣本基本資料建立判別 以命名,如下:
模型, – 引領風潮者
• 將沒手機的樣本放入判別 – 流行擁護者
模型判別,找出最有可能 – 健康主義者
是屬於哪一群的潛在客戶
, – 中庸型顧客
• 配合專業知識,提出行銷 – 挑剔型顧客
建議;

08/21/09 71
集群一:引領風潮者
學生 台北縣( 63﹪ )
家庭主婦 嘉義市( 82﹪ )
  彰化縣( 29﹪ ) 特色:
上班族 苗栗縣( 47﹪ ) •新穎的 外觀
勞工 台南市、 20~29 歲( 38﹪ ) •合弦鈴 聲、 聊天室 、購物

指南、影 像 寫真 …等 的功

行銷建議 :
只要有夠 酷、 夠炫、 有別
於他人, 獨樹 一格( 會唱
歌、彩色 螢幕 、 WAP 等)
08/21/09 的手機, 便可 吸引他 們的72
集群二:流行擁護者
學生 高雄市( 50﹪ )
台南市( 50﹪ ) 特色:
上班族
桃園縣( 33﹪ ) •品牌知 名度 高
台北市、高中高職( 36﹪ )
•WAP 上網、 備忘 錄功能
基隆市、 20 歲以下( 46﹪ )
•全球定 位式 系統
基隆市、 50~59 歲( 33﹪ )
勞工 台中市、外省籍( 100﹪ )
台南市、 40~49 歲( 92﹪ )
行銷建議 :
台北縣、客家籍、 此一族群 的消 費者選 擇三 大
男性、 20~29 歲( 44﹪ ) 知名品牌 (摩 托羅拉 、易 利
信、諾基 亞) ,只要 系統 廠
商與手機 業者 時時推 出三 大
品牌新手 機與 門號, 便可 打
08/21/09
動此族群 消費 者的心 。 73
集群三:健康主義者
學生 台北市( 57﹪ )
家庭主婦 台南市( 39﹪ ) 特色:
上班族 宜蘭縣( 42﹪ ) •操作簡 便
高雄市、國中以下( 30﹪ )
•親子互 動式 手機
台中市、本省閩 南籍( 39﹪ )
台北縣、客家籍、
男性( 48﹪ ) 行銷建議 :
勞工
台北縣、外省籍、 可結合具 有健 康概念 的手
40~49 歲( 100﹪ ) 機,撘配 系統 門號, 推出
台北縣、客家籍、
女性、 30~39 歲( 60﹪ )
以減低電 磁波 對人體 的傷
害為主軸 的行 銷策略 ,較
能吸引健 康主 義者的 消費
者。
08/21/09 74
集群四:中庸型顧客
學生 桃園縣( 79﹪ )
台北市( 50﹪ )
高雄市( 65﹪ ) 特色:
家庭主婦
台中市( 74﹪ ) •堅固耐 用的 款式
雲林縣( 64﹪ ) •手機的 防摔 、防震 、防水
台北市( 36﹪ ) 功能
上班族 高雄市( 54﹪ )
新竹縣( 92﹪ )
行銷建議 :
宜蘭縣( 88﹪ )
台北市、國中以下( 44﹪ )
建議業者 在手 機的促 銷上
勞工 應多考慮 提供 其他品 牌的
台北縣、外省籍、
20 歲以下( 100﹪ ) 手機,以 因應 此一集 群消
費者之需 求。
08/21/09 75
特色:
集群五:挑剔型顧客
專業人員( 43﹪ )
WAP 上網
學生 南投縣( 56﹪ )
• 投資 理財
上班族 新竹縣( 50﹪ ) • 網路 下單
勞工 高雄市、大專以上( 56﹪ )
行銷建議 :
 如增 設基 地台以 加強 收
訊品 質、 降低通 話費 率
、增 設服 務站、 加強 員
工訓 練以 提昇其 工作 效
率與 服務 態度、 品質 。
 手機 廠商 在外型 的設 計
上, 應增 加其外 型的 多
08/21/09 樣性 。 76
商業智慧之整合運用
「不論是行銷或服務部門,如何將分析所得到的資訊,進一步轉換成
經營管理可資利用的材料,並且在實際線上作業環境中,將整個回應
機制完全自動化,充分運用這些資訊。」

企業資源規劃系統 (ERP)



分 投資報酬率 (ROI)
析 客戶關係管理 (CRM)

電子商務 (EC)

08/21/09 77
客戶關係管理系統架構
整合 分析
客戶資 料及 客戶接觸 管道
相關 訊息平 台

授權交易 產品定位 分析

全方 位客 戶觀點
客戶歷史 資料
行銷活動
資料擷 轉
•人口統 計
 資料擷 取 客戶 結構分析 行銷活動 分析經營績效 分析
•客戶關 係
 資料轉 置 •交易行 為
 資料載 入
銷售通路 •交易產 品
•生活形 態

客戶忠誠 分析
客服系統

08/21/09 78
客戶結構分析 (Customer Profile
Analysis)

•瞭解客群面貌
•瞭解不同客群間之交易習性
•瞭解客戶貢獻分 ( 集中?分散? )
•建立並描述客戶區隔
•分析客層遷移行為

結構分析
客戶金字塔遷移
(Structure Analysis) Customer Pyramid Migration)

伯拉圖分析
(Pareto Analysis)

08/21/09 79
產品定位分析 (Product Position
Analysis)

•瞭解產品是否符合客戶需求
•找出潛在交叉行銷機會
•找出產品組合市場接受度高之客群
•找出最佳產品組合

產品滲透 產品組合
產品定位

08/21/09 80
行銷活動分析

公司策略 目標客戶
活動焦點 活動目標 媒體管道

業務導向 目標產品

促 創
銷 意
方 表
案 現

檢核評估
市場測試

監播 ( 聽 ) 成本效益
活動績效衡量
活動績效衡量 分析
控制

08/21/09 81
客戶忠誠分析

•瞭解不同忠誠度客戶之結構與貢獻
•瞭解不同忠誠度客戶之遷移與獲利
•瞭解高忠誠客戶是否極高獲利客戶

交叉分析忠誠度結構、遷移與獲利

08/21/09 82
經營績效分析 (Business Performance
Analysis)

分析重要產品銷售趨勢

瞭瞭
解解
戶經
潛營
藏指
違標
約變
風化
險趨

分析掛帳比率與延滯比率結構

08/21/09 83
CRM 在電信客戶銷售行為上的運用

•顧客 / 行銷分析:
–顧客價值分析
–顧客型態描繪及區隔
–顧客流失及贏回分析
–市場佔有率
•產品促銷分析:
–顧客購買模式
–手機 及相關 品使用率及關聯分析
–資料庫或電話行銷
–手機 及相關 品收益分析
–手機 及相關 品費率分析
•市場模型分析:
–手機 及相關 品創新
–顧客獲取及目標市場
–定價實驗
–市場分析
08/21/09
– 3G 及未來市場模型84..
Data Mining- 各個領域的好幫手 Useful
Analysis Tool

08/21/09 85
現象 = 模型 + 誤差
Data Mining ­­ Find the MODEL

08/21/09 86
做的好不如做的早 Data Mining It’s New ! It’s Hot !

德 What are you waiting for ? 法


相 身
非 無
空 去
非 無
有 來

應 住
隨 寂
機 光
以 而
恆 不
周 動
08/21/09 87
Your issue. Our solution.
08/21/09 88

You might also like