You are on page 1of 30

Review

North-Data Mining For


the masses
Deden Istiawan
P31.2015.01756

Chapter IV
Correlation

Business Understanding
Sarah adalah seorang manajer penjualan
regional untuk pemasok nasional bahan
bakar minyak pemanas ruangan. Sarah
merasa perlu untuk memahami jenis
perilaku dan faktor-faktor lain yang dapat
mempengaruhi
permintaan
pemanas
minyak
di
pasar
domestik.
Dia
menganalisa bahwa ada beberapa faktor
yang dapat mempengaruhi konsumsi
heating oil

Evaluation

Dari matrik korelasi dapat diketahui bahwa


yang mempunyai hubungan paling besar
terhadap permintaan minyak pemanas adalah
rata-rata umur penghuni rumah. Semakin
tinggi rata-rata umur penghuni rumah
semakin besar permintaan minyak pemanas

Chapter V
Association Rules

Business Understanding
Roger adalah seorang walikota. Dia
merasa masyarakat yang cukup aktif
dalam berbagai organisasi. Ada beberapa
ornganisasi dalam masyarakat. Adakah
hubungan diantara oraganisasi tersebut
yang memungkinkan untuk bekerja
sama. . Dia harus mencari tahu apakah
ada asosiasi yang ada di antara berbagai
jenis organisasi yang ada

evaluation

Yang mempunyai asosiasi paling tinggi


adalah hobi dan organisasi agama. Selain
itu ada organisasi keluarga dan agama.

Chapter VI
K-Mean Clustering

Business Understanding
Sonia adalah direktur program untuk
penyedia
asuransi
kesehatan.
Dia
membaca jurnal medis dan artikel
lainnya, dan menemukan sesuatu yang
berpengaruh pada berat badan, jenis
kelamin, kolesterol pada penyakit jantung
koroner.
menggunakan
database
perusahaan asuransi, ada sebanyak 547.
Sonia ingin mengelompokan menjadi
empat kelompok yaitu tinggi, cukup
tinggi, sedang, dan rendah resiko jatung

evaluation

Yang mempunyai asosiasi paling tinggi


adalah hobi dan organisasi agama. Selain
itu ada organisasi keluarga dan agama.

evaluation

Dari klaster yang terbentuk yang mempunyai


resiko tinggi jatung koroner adalah klaster 0
karena mempunyai rata-rata berat badan
kolesterol tinggi. Yang menjadi target asuransi
adalah mereka yang berada di klaster 4 karena
resiko terkena jantung koroner rendah sehingga
meminimumkan claim ke perusahaan

Chapter VII
Discriminant analysis

Business Understanding
Gill menjalankan akademi olahraga yang
dirancang untuk membantu atlit SMA
mencapai potensi maksimal. Dia berfokus
pada 4 olahraga utama, football,
basketball, baseball dan hockey. Tujuan
Gill adalah memeriksa atlit muda
berdasarkan kinerja mereka, membantu
mereka memutuskan olahraga apa yang
harusnya dipilih. Gill meminta bantuan
kita untuk melakukan percobaan data
mining menentukan bakat atletik

evaluation

Untuk olahraga basketball & football adalah


mereka
yang
mempunyai
strength
&
endurance tinggi.
Untuk
olahraga
baseball
adalah
yang
mempunyai strength rendah tapi endurance
tinggi

Chapter VIII
Linear regression

Business Understanding
Sarah merupakan manager marketing
kembali
meminta
bantuan
karena
penjualan
minyak
pemanasnya
meningkat. Ada banyak pelanggan baru
yang belum mengkonsumsi heating oil
42.650 tepatnya, dan dia ingin tahu
seberapa banyak heating oil yang
dibutuhkan untuk mencukupi permintaan
tersebut

evaluation

Heatingoil=134,511+3,323(insulation)0,0869(tempetatue)+1,968(avg_age)
+3,173(home size)

Hasil estimasi

Chapter IX
Logistic Regression

Business Understanding
Sonia,
direktur
program
asuransi
kesehatan yang ada pada chapter 6
kembali meminta bantuan. Dia sangat
terbantu dengan project clustering, kali
ini dia merasa prihatin terhadap mereka
yang menderita serangan jantung. Sonia
ingin membantu meningkatkan gaya
hidup mereka, termasuk mengelola berat
badan dan stres agar meningkatkan
peluang tidak terkena serangan jantung
lagi

evaluation

Chapter X
Decision Tree

Business Understanding
Richard bekerja untuk perusahaan retail
online Perusahaannya akan segera
meluncurkan e-reader next-generation.
Richard
percaya
bahwa
dengan
memining data pelanggan dari perilaku
mereka di website, dia akan mengetahui
mana
pelanggan
yang
membeli
cepat/awal, mana yang membeli dalam
waktu dekat, mana yang membeli nanti

evaluation

Decision tree memberitahu kita apa yang dirediksi,


seberapa besar confidence nya, dan bagaimana hasil
prediksi, semuanya ditampilkan pada tampilan grafis
decision tree

Chapter XI
Neural Network

Business Understanding
Juan merupakan analis performa statistik
untuk tim atletik profesional. Tim nya
terus berkembang selama satu musim
terakhir
dan
menuju
kemusim
berikutnya, manajemen tim percaya
bahwa dengan menambah 2 atau 4
pemain hebat maka tim ini akan berdiri
dipucuk
liga
champion.
Dia
menginginkan
sebuah
dataset
dari
semua pemain di liga untuk membantu
menemukan calon pemain, tetapi gaji

evaluation

59 nama yang telah dikategorikan, jadi


Juan dapat dengan mudah memilih
pemain berdasarkan posisinya

Chapter XII
Neural Network

Business Understanding
Gillian adalah seorang sejarawan dan arsiparis di
museum nasional di Amerika Serikat. The Papers
Federalist adalah serangkaian puluhan esai yang
ditulis dan diterbitkan pada akhir 1700-an.
Hamilton meninggal pada tahun 1804, beberapa
catatan ditemukan bahwa mengungkapkan bahwa
ia (Hamilton), James Madison dan John Jay telah
penulis makalah. untuk kertas 3, 4 dan 5; Madison
untuk kertas 14; dan Hamilton untuk kertas 17.
Kertas 18 tidak memiliki penulis bernama, tapi ada
bukti bahwa Hamilton dan Madison bekerja pada
salah satu yang bersama-sama.

evaluation

Setelah model dijalankan kita bisa melihat


hasil yang berbeda, yang menunjukkan
bahwa paper 18 ada kaitannya dengan
paper Hamilton dan Madison

You might also like