Professional Documents
Culture Documents
1. Hal itu dikarenakan pada teknik pemodelan klasik dalam melakukan analisa terhadap
beberapa set data yang besar memerlukan waktu timing yang lama, sehingga akan menyebabkan kurangnya keefektifitasan waktu yang digunakan.
Klasifikasi : Pengklasifikasian jadwal berdasarkan tujuan tempat yang akan didatangi. Regresi : Penggunaan variabel tertentu, seperti mengklasifikasikan jadwal dari tanggal keberangkatan.
Penyimpangan : Pendeteksian dari jadwal yang ada, sehingga dapat ditindak lanjuti kembali apakah sesuai atau sudah dipesan.
3. -
Pendekatan statistik : analisis data yang menggunakan perhitungan matematika dalam menganalisa data.
Machine Learning : merupakan hasil dari kecerdasan buatan yang berhubungan dengan pengembangan teknik yang dapat diprogramkan dan mempelajari dari masa lampau.
4. Karena dalam preprocessing data memberikan representasi optimal untuk teknik dalam
data-mining dengan memasukkan pengetahuan apriori dalam bentuk aplikasi khusus scaling dan encoding. Dan dengan adanya pengurangan dimensi disini membantu untuk menyediakan sejumlah kecil fitur inormatif untuk pemodelan data berikutnya.
5. Contohnya dalam perhitungan perbedaan waktu yang ada dalam data-mining secara
implisit dan juga eksplisit, dimana secara eksplisit waktu dijangkau dalam hitungan hari, mingguan dan bulanan. Sedangkan secara implisit data tersebut direkap setiap tiga minggu sekali.
6. Karena dalam pengambilan keputusan data harus sesuai dengan kondisi yang diperlukan
sertaharus dipahami dengan baik, kemudian user juga harus tahu bahwa data sesuai dengan domain yang telah ditetapkan.
7. Klasifikasi Data : Data Tersetruktur : Video yang direkam oleh kamera pengintai pada sebuah supermarket, rumah sakit, kantor dan di tempat umum lainnya. Data semi-terstruktur : gambar elektronik dari dokumen bisnis, laporan medis, dan sebagaian besar dokumen web. Data tidak terstruktur : biasanya ada pada teks, file, video, email dan sebagainya.
8. 50,000 contoh data dapat kita kategorikan sebagat data yang besar karena masing-masing
9. Data warehouse sebenarnya dapat diidntifikasikan sebagai salah satu kunci teknik
pendukung pada setiap tugas data-mining dalam tahap pra-persiapan data. Sehingga jika data warehouse sesuai dengan kebutuhan model data-mining, maka dapat langsung digunakan oleh program data-mining.
10. OLAP sangatlah penting pada proses data-mining karena digunakan dalam penarikan
kesimpulan dalam suatu permasalahan dan melakukan analisis melalui sebuah pendekatan secara cepat dan mengambil keputusan dari jawaban-jawaban yang berdasarkan data grafis.