You are on page 1of 18

Other approaches, such as association and classification rules, joining the declarative nature of rules, and

the availability of learning mechanisms including inductive logic programming, are of great potential for
effectively merging DM and KM (Amini et al., 2007).
Pendekatan lain, seperti asosiasi dan aturan klasifikasi, bergabung sifat deklaratif aturan, dan
ketersediaan mekanisme pembelajaran termasuk pemrograman logika induktif, adalah potensi besar
untuk secara efektif penggabungan DM dan KM (Amini dkk., 2007).
/xvi
A first challenge in discovery knowledge from local patterns in SAGE data is to perform the local pattern
extractions. Recalling that few years ago it was impossible to mine such patterns in large datasets and
only association rules with rather a high frequency threshold were used (Becquet et al., 2002).
Tantangan pertama dalam penemuan pengetahuan dari pola lokal di SAGE data adalah untuk melakukan
ekstraksi pola lokal. Mengingat bahwa beberapa tahun yang lalu tidak mungkin untuk menambang pola
tersebut dalam dataset besar dan aturan asosiasi hanya dengan agak ambang frekuensi tinggi digunakan
(Becquet et al., 2002).
/262
Association rule (AR) mining can overcome these drawbacks, however transcriptomic data represent a
difficult mining context for association rules. First, the data are high-dimensional (typically contain several
thousands of attributes), which asks for an algorithm scalable in the number of attributes.
Second, expression values are typically quantitative variables. This variable type further increases
computational demands and moreover may result in an output with a prohibitive number of redundant
rules. Third, the data are often noisy which may also cause a large number of rules of little significance.
In this section we discuss the above-mentioned bottlenecks and present results of mining association
rules using an alternative approach to quantitative association rule mining. We also demonstrate a way in
which background genomic knowledge can be used to prune the search space and reduce the amount of
derived rules.
Asosiasi aturan (AR) pertambangan dapat mengatasi kelemahan ini, namun data yang transcriptomic
mewakili konteks pertambangan sulit bagi aturan asosiasi. Pertama, data yang tinggi-dimensi (biasanya
berisi beberapa ribu atribut), yang meminta sebuah algoritma scalable dalam jumlah atribut.
Kedua, nilai-nilai ekspresi biasanya variabel kuantitatif. Jenis variabel lebih lanjut meningkatkan tuntutan
komputasi dan terlebih lagi dapat menyebabkan output dengan sejumlah penghalang aturan berlebihan.
Ketiga, data sering berisik yang juga dapat menyebabkan sejumlah besar aturan signifikansi kecil.
Pada bagian ini kita membahas di atas kemacetan dan hasil sekarang dari aturan pertambangan asosiasi
menggunakan pendekatan alternatif untuk association rule mining kuantitatif. Kami juga menunjukkan
cara di mana latar belakang pengetahuan genom dapat digunakan untuk memangkas ruang pencarian
dan mengurangi jumlah aturan turunan.
/284
To avoid this discretization step, authors in (Georgii, 2005) investigate the use of quantitative association
rules, i.e., association rules that operate directly on numeric data and can represent the cumulative
effects of variables.
Untuk menghindari hal ini langkah diskritisasi, penulis dalam (Georgii, 2005) menyelidiki penggunaan
aturan asosiasi kuantitatif, yaitu, asosiasi aturan yang beroperasi secara langsung pada data numerik
dan dapat mewakili efek kumulatif dari variabel.
/284
Association Rule: A rule, such as implication or correlation, which relates elements co-occurring within a
dataset.
Asosiasi Peraturan: Sebuah aturan, seperti implikasi atau korelasi, yang berkaitan unsur co-terjadi di
dalam dataset.
/291

The ever-increasing number of electronic patients records, specialized medical databases, and various
computer-stored clinical files provides an unprecedented opportunity for automated and semi-automated
discovery of patterns, trends, and associations in medical data.
Jumlah yang terus meningkat dari catatan pasien elektronik ', database medis khusus, dan berbagai file
komputer disimpan klinis memberikan kesempatan belum pernah terjadi sebelumnya untuk penemuan
otomatis dan semi-otomatis pola, tren, dan asosiasi dalam data medis.
/351
Several methods are available for the integration of domain knowledge into DM in various applications,
using different representation methods. For example, ontologies are used in the preprocessing phase to
reduce dimensionality, in the mining phase to improve clustering and association rules, and in the postprocessing phase to evaluate discovered patterns (Maedche et al., 2003).
Beberapa metode yang tersedia untuk integrasi pengetahuan domain ke DM dalam berbagai aplikasi,
dengan menggunakan metode representasi yang berbeda. Misalnya, ontologi digunakan dalam tahap
preprocessing untuk mengurangi dimensi, dalam tahap pertambangan untuk memperbaiki clustering dan
aturan asosiasi, dan tahap pasca-pengolahan untuk mengevaluasi pola ditemukan (Maedche et al.,
2003).
/355
According these questions, various data mining tasks can be formulated. The descriptive tasks associations or segmentation (subgroup discovery), are used if the main purpose of the data mining is to
find some relation between attributes or examples.
Menurut pertanyaan ini, berbagai data tugas mining dapat dirumuskan. Tugas deskriptif - asosiasi atau
segmentasi (penemuan subkelompok), digunakan jika tujuan utama dari data mining adalah untuk
menemukan beberapa hubungan antara atribut atau contoh.
/382
Association Rules: Relation between two Boolean attributes, It is defined by a condition concerning
contingency table of these attributes. Usually, this condition is given by lower thresholds for confidence
and support.
Asosiasi Aturan: Hubungan antara dua atribut Boolean, Hal ini didefinisikan oleh kondisi tentang tabel
kontingensi dari atribut tersebut. Biasanya, kondisi ini diberikan oleh ambang rendah untuk kepercayaan
dan dukungan.
/397
JI [08] Data Mining and Medical Knowledge Management, Cases and Applications, Petr Berka, Jan
Rauch, Djamel Abdelkader Zighed, IGI Global, 2009.
Data mining analyzes data previously collected; it is non-experimental. There are several different data
mining products. The most common are conditional rules or association rules.
Data mining menganalisis data yang dikumpulkan sebelumnya, itu adalah non-eksperimental. Ada
beberapa data yang berbeda produk pertambangan. Yang paling umum adalah aturan kondisional atau
aturan asosiasi.
/31
At first glance, association rules seem to imply a causal or cause-effect relationship. That is: A customers
purchase of both sausage and beer causes the customer to also buy hamburger.
Sekilas, aturan asosiasi tampaknya menyiratkan hubungan kausal atau sebab-akibat. Yaitu: Pembelian
pelanggan dari kedua sosis dan bir menyebabkan pelanggan untuk juga membeli hamburger.
/31
Association rules are used is to aid in making retail decisions. However, simple association rules may
lead to errors. Errors might occur; either if causality is recognized where there is no causality; or if the
direction of the causal relationship is wrong [20, 35].

Aturan asosiasi yang digunakan adalah untuk membantu dalam membuat keputusan ritel. Namun,
asosiasi aturan sederhana dapat menyebabkan kesalahan. Kesalahan mungkin terjadi, baik jika
kausalitas diakui di mana ada kausalitas tidak ada, atau jika arah hubungan kausal yang salah [20, 35].
/33
Associations between these patterns are then found by applying a data mining technique based on rough
set analysis. Further work and applications to discover knowledge about patterns in sequences are
currently in process.
Asosiasi antara pola-pola tersebut kemudian ditemukan dengan menerapkan teknik data mining
berdasarkan analisis set kasar. Pekerjaan lebih lanjut dan aplikasi untuk menemukan pengetahuan
tentang pola-pola dalam urutan saat ini dalam proses.
/159
An association is said to exist between two sets of items when a transaction containing one set is likely to
also contain the other.
Asosiasi dikatakan ada di antara dua set item ketika transaksi yang mengandung satu set mungkin juga
mengandung yang lain.
/163
Association rules are based on the notion of frequent sets of attributes which appear in many documents.
Maximal association rules are based on frequent maximal sets of attributes which appear maximally in
many documents. The regular association rule X Y means that if X then Y (with some confidence).
Aturan asosiasi didasarkan pada gagasan set sering atribut yang muncul dalam banyak dokumen.
Maksimal asosiasi aturan didasarkan pada set maksimal sering atribut yang muncul secara maksimal di
banyak dokumen. Asosiasi aturan reguler X Y berarti bahwa jika X maka Y (dengan keyakinan
tertentu).
/182
Association rules (ARs) emerged in the domain of market basket analysis and provide a convenient and
effective way to identify and represent certain dependencies between attributes in a database.
Asosiasi aturan (ARS) muncul dalam domain analisis market basket dan menyediakan cara yang nyaman
dan efektif untuk mengidentifikasi dan mewakili dependensi tertentu antara atribut dalam database.
/203
Association rules can be rated by a number of quality measures, among which support and confidence
stand out as the two essential ones.
Aturan asosiasi dapat dinilai oleh sejumlah langkah yang berkualitas, di antaranya dukungan dan
kepercayaan berdiri sebagai dua yang penting.
/206
Data mining includes several kinds of technologies such as association rule analysis, classification,
clustering, sequential pattern etc. In the chapter, we focus on association rule mining since it has been
applied in many fields and considered an important method for discovering associations among data [23].
Data mining meliputi beberapa macam teknologi seperti analisis aturan asosiasi, klasifikasi, clustering, dll
pola sekuensial Dalam bab ini, kita fokus pada association rule mining karena telah diterapkan di
berbagai bidang dan dianggap sebagai metode penting untuk menemukan asosiasi antara data [23].
/225
An association rule is an expression X Y meaning that if X occurs, then Y occurs at the same time,
where X and Y are sets of items, X I, Y I, and X Y = .
Aturan asosiasi adalah ekspresi X Y arti bahwa jika X terjadi, maka Y terjadi pada saat yang sama, di
mana X dan Y adalah set item, X saya, Y I, dan X Y = .
/225

A lot of research has been carried out in the past by using association rules to build more accurate
classifiers. The idea behind these integrated approaches is to focus on a limited subset of association
rules.
Banyak penelitian telah dilakukan di masa lalu dengan menggunakan aturan asosiasi untuk membangun
pengklasifikasi lebih akurat. Ide di balik pendekatan terpadu adalah fokus pada subset terbatas dari
aturan asosiasi.
/253
As mentioned above, association and classification rules are the two main learning algorithms in
associative classification. The study of association rules is focused on using exhaustive search to find all
rules in data that satisfy user-specified minimum support and minimum confidence criteria. On the other
hand, classification rules aim to discover a small set of rules to form an accurate classifier.
Sebagaimana disebutkan di atas, asosiasi dan peraturan klasifikasi adalah dua algoritma pembelajaran
utama dalam klasifikasi asosiatif. Studi tentang asosiasi aturan difokuskan pada menggunakan
exhaustive search untuk menemukan semua aturan dalam data yang memuaskan yang ditentukan
pengguna minimum support dan kriteria keyakinan minimum. Di sisi lain, aturan klasifikasi bertujuan
untuk menemukan satu set kecil aturan untuk membentuk sebuah classifier yang akurat
/254
Association rules will search globally for all rules that satisfy minimum support and minimum confidence
norms. They will therefore contain the full set of rules, which may incorporate important information. The
richness of the rules gives this technique the potential of reflecting the true classification structure in the
data [17].
Aturan asosiasi akan mencari secara global untuk semua aturan yang memenuhi minimum support dan
norma kepercayaan minimum. Oleh karena itu mereka akan berisi set lengkap aturan, yang dapat
memasukkan informasi penting. Kekayaan aturan teknik ini memberikan potensi yang mencerminkan
struktur klasifikasi benar dalam data [17].
/255
JI [10] Intelligent Data Mining, Techniques and Applications, Da Ruan, Guoqing Chen, Etienne E. Kerre,
Geert Wets, Springer, 2005.
Two key statistics in association rule mining are support and confidence, which measure the number of
cases (i.e., the database transactions in association rule mining) that contain a rules antecedent and
consequent parts and the number of cases that contain the consequent part among those containing the
antecedent part, respectively.
Dua statistik penting dalam association rule mining adalah dukungan dan kepercayaan, yang mengukur
jumlah kasus (misalnya, transaksi database dalam association rule mining) yang mengandung anteseden
aturan dan bagian konsekuen dan jumlah kasus yang berisi bagian konsekuen antara mereka
mengandung bagian pendahuluan, masing-masing.
/5
Two other differences should be noted between associative classification and decision trees. The first one
is that association rules were built primarily for boolean data [5], where only the presence of attributes is
of interest for the user. The second, linked to the previous one, is that the usual measures of the interest
of a rule, such as the confidence or the lift, take into account only the cases covered by the rule.
Thereafter, various algorithms have been developed to build association rules between categorical and
numerical attributes (see, for example, [21, 25]).
Dua perbedaan lain harus dicatat antara klasifikasi asosiatif dan pohon keputusan. Yang pertama adalah
bahwa hubungan aturan dibangun terutama untuk data boolean [5], di mana hanya keberadaan atribut
yang menarik bagi pengguna. Yang kedua, terkait dengan yang sebelumnya, adalah bahwa orang yang
biasa kepentingan aturan, seperti keyakinan atau lift, mempertimbangkan hanya kasus-kasus tertutup
oleh aturan. Setelah itu, berbagai algoritma telah dikembangkan untuk membangun aturan hubungan
antara atribut kategorikal dan numerik (lihat, misalnya, [21, 25]).
/77

JI [11] Data Mining, Special Issue in Annals of Information Systems, Robert Stahlbock, Sven F. Crone,
Stefan Lessmann, Springer, Nov. 2009.
Problem statement
The problem of mining association rules over market basket analysis was introduced in (Agrawal,
Imielinski, & Swami, 1993; Agrawal & Srikant, 1994). The problem consists of finding associations
between items or itemsets in transactional data. The data is typically retail sales in the form of customer
transactions, but can be any data that can be modeled into transactions.
Masalah pertambangan aturan asosiasi atas analisis market basket diperkenalkan di (Agrawal, Imielinski,
& Swami, 1993; Agrawal & Srikant, 1994). Masalahnya terdiri dari menemukan asosiasi antar item atau
itemset dalam data transaksional. Data ini biasanya penjualan eceran dalam bentuk transaksi nasabah,
tetapi tidak boleh data yang dapat dimodelkan ke dalam transaksi.
/33
Since the introduction of association rules a decade ago and the launch of the research in efficient
frequent itemset mining, the development of effective approaches for mining large transactional
databases has been the focus of many research studies.
Sejak diperkenalkannya asosiasi memerintah satu dekade yang lalu dan peluncuran penelitian di bidang
pertambangan itemset yang efisien sering, pengembangan pendekatan yang efektif untuk database
transaksional pertambangan besar telah menjadi fokus studi penelitian banyak.
/53
Besides all-confidence (Omiecinski, 2003), other measures of association have been proposed to extract
interesting patterns in large data sets. For example, Brin, Motwani, and Silverstein (1997) introduced the
interest measure and 2 test to discover patterns containing highly dependent items. However, these
measures do not possess the desired anti-monotone property.
Selain semua keyakinan-(Omiecinski, 2003), langkah-langkah lain dasar Perusahaan telah diusulkan
untuk mengekstrak pola menarik dalam kumpulan data besar. Sebagai contoh, Brin, Motwani, dan
Silverstein (1997) memperkenalkan ukuran bunga dan 2 test untuk menemukan pola yang berisi item
sangat tergantung. Namun, tindakan ini tidak memiliki properti anti monoton diinginkan.
/60
This chapter introduces a data mining method for the discovery of association rules from images of
scanned paper documents.
Bab ini memperkenalkan metode data mining untuk penemuan aturan asosiasi dari gambar dokumen
kertas yang dipindai.
/176
JI [13] Data Mining Patterns, New Methods And Applications, Pascal Poncelet, Florent Masseglia,
Maguelonne Teisseire, IGI Global, 2008.
Data mining is a process concerned with uncovering patterns, associations, anomalies and statistically
significant structures in data (Fayyad et al., 1996). It typically refers to the case where the data is too
large or too complex to allow either a manual analysis or analysis by means of simple queries.
Data mining adalah proses yang bersangkutan dengan mengungkap, asosiasi pola, anomali dan struktur
signifikan secara statistik pada data (Fayyad et al., 1996). Ini biasanya mengacu pada kasus di mana
data terlalu besar atau terlalu rumit untuk memungkinkan analisis baik manual atau analisis dengan
menggunakan pertanyaan sederhana.
/49

It is worth noting here that there is another class of algorithms that may also be used to deliver nuggets:
association rule algorithms (Agrawal, Imielinski & Swami, 1993; Agrawal Mannila, Srikant, Toivonen &
Verkamo, 1996). They were developed for transaction data (also known as basket data). This type of data
contains information on transactions, for example, showing items that have been purchased together.
Association rule mining algorithms deliver a set of association rules, often containing all associations
between items above certain support and confidence thresholds. The association rules are generally of
the form customers that purchase bread and butter also get milk, with 98 % confidence. This type of rule
is not constrained to have a particular value as output, or indeed to refer to any particular attribute.
Delivering all association rules in transactional data is a suitable approach, since transactional data tends
to contain few associations. Classification datasets, however, tend to contain many associations, so
delivering all association rules for a classification dataset results in output of overwhelming size. Also
classification datasets often contain many numeric continuous attributes, and association rule induction
algorithms are not designed to cope with this type of data. Therefore, although association rules can be
used for classification (Bayardo, 1997;
Liu, Hsu & Ma, 1998), and even for partial classification or nugget discovery (Ali et al., 1997), work is
required to adapt the association algorithms to cope with classification data, and with the problem of
partial classification or nugget discovery.
Perlu dicatat di sini bahwa ada kelas lain dari algoritma yang dapat juga digunakan untuk memberikan
nugget: algoritma association rule (Agrawal, Imielinski & Swami, 1993; Agrawal Mannila, Srikant,
Toivonen & Verkamo, 1996). Mereka dikembangkan untuk data transaksi (juga dikenal sebagai data
keranjang). Jenis data berisi informasi tentang transaksi, misalnya, menunjukkan item yang telah dibeli
bersama-sama. Asosiasi aturan algoritma pertambangan memberikan satu set aturan asosiasi, sering
berisi semua item di atas hubungan antara dukungan tertentu dan ambang batas keyakinan. Aturan
asosiasi umumnya dari bentuk "Pelanggan yang membeli roti dan mentega juga mendapatkan susu,
dengan keyakinan 98%." Jenis aturan tidak dibatasi untuk memiliki nilai tertentu sebagai output, atau
bahkan untuk mengacu pada setiap atribut tertentu. Menyampaikan semua aturan asosiasi dalam data
transaksi adalah pendekatan yang cocok, karena data transaksional cenderung mengandung beberapa
asosiasi. Dataset klasifikasi, bagaimanapun, cenderung mengandung banyak asosiasi, sehingga
memberikan semua aturan asosiasi untuk hasil klasifikasi dataset dalam output ukuran besar. Juga
dataset klasifikasi sering mengandung banyak atribut kontinyu numerik, dan algoritma induksi aturan
asosiasi tidak dirancang untuk mengatasi dengan jenis data. Oleh karena itu, meskipun asosiasi aturan
dapat digunakan untuk klasifikasi (Bayardo, 1997; Liu, Hsu & Ma, 1998), dan bahkan untuk klasifikasi
parsial atau nugget penemuan (Ali et al., 1997), kerja diperlukan untuk mengadaptasi algoritma asosiasi
untuk mengatasi klasifikasi data, dan dengan masalah klasifikasi parsial atau nugget penemuan .
/74
Techniques for data mining include mining association rules, data classification, generalization, clustering,
and searching for patterns (Chen, Han, & Yu, 1996). The focus of data mining is to reveal information that
is hidden and unexpected, as there is little value in finding patterns and relationships that are already
intuitive. By discovering hidden patterns and relationships in the data, data mining enables users to
extract greater value from their data than simple query and analysis approaches.
Teknik untuk data mining meliputi pertambangan aturan asosiasi, klasifikasi data, generalisasi, clustering,
dan mencari pola (Chen, Han, & Yu, 1996). Fokus dari data mining adalah untuk mengungkapkan
informasi yang tersembunyi dan tak terduga, karena ada nilai yang kecil dalam menemukan pola dan
hubungan yang sudah intuitif. Dengan menemukan pola-pola tersembunyi dan hubungan dalam data,
data mining memungkinkan pengguna untuk mengekstrak nilai yang lebih besar dari data mereka dari
query sederhana dan analisis pendekatan.
/262
There are many data mining techniques being proposed in the literature. The most common ones, which
will be included in this section, are association rules (Agrawal & Srikant, 1994), sequential patterns
(Agrawal & Srikant 1995; Srikant & Agrawal, 1996; Zaki 1998), classification (Agrawal, Ghosh, Imielinski,
Iyer, & Swami, 1992; Alsabti, Ranka, & Singh, 1998; Mehta, Agrawal & Rissanen, 1996; Shafer, Agrawal,
& Mehta, 1996), and clustering (Aggarwal, Procopiuc, Wolf, Yu, & Park, 1999; Agrawal, Gehrke,
Gunopulos, & Raghavan, 1998; Cheng, Fu & Zhang, 1999; Guha, Rastogi & Shim, 1998; Ng & Han,
1994; Zhang, Ramakrishnan & Livny, 1996).

Ada beberapa teknik pertambangan banyak data yang diusulkan dalam literatur. Yang paling umum, yang
akan dimasukkan dalam bagian ini, aturan asosiasi (Agrawal & Srikant, 1994), pola sekuensial (Agrawal
& Srikant 1995; Srikant & Agrawal, 1996; Zaki 1998), klasifikasi (Agrawal, Ghosh, Imielinski, Iyer, &
Swami, 1992; Alsabti, Ranka, & Singh, 1998; Mehta, Agrawal & Rissanen, 1996; Shafer, Agrawal, &
Mehta, 1996), dan clustering (Aggarwal, Procopiuc, Wolf, Yu, & Park, 1999; Agrawal, Gehrke, Gunopulos,
& Raghavan, 1998; Cheng, Fu & Zhang, 1999; Guha, Rastogi & Shim, 1998; Ng & Han, 1994; Zhang,
Ramakrishnan & Livny, 1996).
/269
An association rule is a rule that implies certain association relationships among a set of objects (such as
occur together or one implies the other) in a database. Given a set of transactions, where each
transaction is a set of items, an association rule is an expression of the form X Y, where X and Y are sets
of items. The intuitive meaning of such a rule is that transactions of the database which contain X then
contain Y. An example of an association rule is 25% of transactions that contain instant noodles also
contain Coca Cola; 3% of all transactions contain both of these items. Here 25% is called the confidence
of the rule and 3% the support of the rule. The problem is to find all association rules that satisfy
userspecified minimum support and minimum confidence constraints.
Aturan asosiasi adalah aturan yang menyiratkan hubungan asosiasi tertentu antara satu set objek
(seperti "terjadi bersamaan" atau "satu menyiratkan lainnya") dalam database. Mengingat satu set
transaksi, dimana setiap transaksi adalah satu set item, aturan asosiasi adalah ekspresi dari bentuk XY,
dimana X dan Y adalah set item. Arti intuitif dari aturan tersebut adalah bahwa transaksi dari database
yang berisi X kemudian mengandung Y. Contoh dari aturan asosiasi adalah "25% dari transaksi yang
mengandung mie instan juga mengandung Coca Cola, 3% dari seluruh transaksi mengandung kedua
item ". Berikut 25% disebut kepercayaan dari aturan dan 3% dukungan dari aturan. Masalahnya adalah
untuk menemukan semua aturan asosiasi yang memenuhi minimum support userspecified dan kendala
kepercayaan minimum.
/269
JI [14] Data Mining, A Heuristic Approach, Hussein Aly Abbass, Ruhul Amin Sarker, Charles S. Newton,
Idea Group Publishing, 2002
Association rules [3] describe the co-occurrence among data items in a large amount of collected data.
They have been profitably exploited for classification purposes [8, 11, 19]. In this case, rules are called
classification rules and their consequent contains the class label. Classification rule mining is the
discovery of a rule set in the training dataset to form a model of data, also called classifier. The classifier
is then used to classify new data for which the class label is unknown.
Asosiasi aturan [3] menggambarkan co-kejadian di antara item data dalam jumlah besar data
dikumpulkan. Mereka telah menguntungkan dieksploitasi untuk tujuan klasifikasi [8, 11, 19]. Dalam hal ini,
aturan disebut aturan klasifikasi dan akibatnya mereka mengandung label kelas. Klasifikasi rule mining
adalah penemuan ketentuan dalam dataset pelatihan untuk membentuk sebuah model data, juga disebut
classifier. Classifier tersebut kemudian digunakan untuk mengklasifikasikan data baru yang label
kelasnya belum diketahui.
/1
The notion of association rules was introduced by Agrawal et al. [1] and has been demonstrated to be
useful in several domains [4, 5], such as retail sales transaction database. In the theory two standard
measures, called support and confidence, are often used. For documents the orders of keywords or
directions of rules are not essential. Our focus will be on the support; a set of items that meets the support
is often referred to as frequent itemsets; we will call them associations (undirected association rules) as to
indicate the emphasis on their meaning more than the phenomena of frequency.
Gagasan aturan asosiasi diperkenalkan oleh Agrawal et al. [1] dan telah terbukti berguna dalam beberapa
domain [4, 5], seperti database transaksi penjualan ritel. Dalam teori dua ukuran standar, disebut
dukungan dan kepercayaan diri, yang sering digunakan. Untuk dokumen perintah kata kunci atau arah
aturan tidak penting. Fokus kami akan mengarah pada dukungan tersebut; satu set item yang memenuhi

dukungan ini sering disebut sebagai itemset sering, kami akan memanggil mereka asosiasi (asosiasi
tidak diarahkan aturan) untuk menunjukkan penekanan pada makna mereka lebih dari fenomena
frekuensi.
/62
The goal of this step is to determine relationships among variables. In this phase, both statistical methods
(e.g. discriminant analysis, clustering, and regression analysis) and data-oriented methods (e.g. neural
networks, decision trees, association rules) can be used.
Tujuan dari langkah ini adalah untuk menentukan hubungan antar variabel. Pada tahap ini, kedua metode
statistik (misalnya analisis diskriminan, clustering, dan analisis regresi) dan data berorientasi metode
(misalnya jaringan saraf, pohon keputusan, asosiasi aturan) dapat digunakan.
/167
Mining association rules in transaction databases have been demonstrated to be useful and technically
feasible in several application areas [14,18,21] particularly in retail sales, and it becomes every day more
important in applications that use document databases [11, 16, 17]. Although research in this area has
been going on for more than one decade; today, mining such rules is still one of the most popular
methods in knowledge discovery and data mining.
Pertambangan asosiasi aturan dalam database transaksi telah terbukti berguna dan teknis layak di
daerah beberapa aplikasi [14,18,21] khususnya dalam penjualan ritel, dan itu menjadi setiap hari lebih
penting dalam aplikasi yang menggunakan database dokumen [11, 16, 17 ]. Meskipun penelitian di
bidang ini telah berlangsung selama lebih dari satu dekade, hari ini, pertambangan aturan tersebut masih
salah satu metode paling populer dalam penemuan pengetahuan dan data mining.
/198
An association rule is an implication of the form X Y , where X I, Y I, and X Y = . The
association rule X Y holds in the database D with certain quality and a support s, where s is the
proportion of transactions in D that contain X Y . Some quality measures have been proposed, although
these are not considered in this work.
Aturan asosiasi merupakan implikasi dari bentuk X Y, dimana X saya, Y I, dan X Y = . Aturan
asosiasi X Y memegang di D database dengan kualitas tertentu dan dukungan s, dimana s adalah
proporsi transaksi di D yang mengandung X Y. Beberapa ukuran kualitas telah diajukan, meskipun hal
tersebut tidak dipertimbangkan dalam pekerjaan ini.
/198
The first step in the discovery of association rules is to find each set of items (called itemset) that has cooccurrence rate above the minimum support. An itemset with at least the minimum support is called a
large itemset or a frequent itemset. In this chapter, as in others, the term frequent itemset will be used.
The size of an itemset represents the number of items contained in the itemset, and an itemset containing
k items is called a k-itemset. For example, beer, diaper can be a frequent 2-itemset. If an itemset is
frequent and no proper superset is frequent, we say that it is a maximally frequent itemset.
Langkah pertama dalam penemuan aturan asosiasi adalah untuk menemukan satu set item (disebut
itemset) yang memiliki co-kejadian di atas tingkat minimum support. Sebuah itemset dengan sedikitnya
dukungan minimum disebut itemset besar atau frequent itemset. Dalam bab ini, seperti pada orang lain,
frequent itemset istilah akan digunakan. Ukuran suatu itemset merupakan jumlah item yang terdapat
dalam itemset, dan sebuah itemset yang berisi item k disebut k-itemset. Misalnya, bir, popok dapat
menjadi sering 2-itemset. Jika suatu itemset sering terjadi dan tidak ada superset tepat adalah sering, kita
mengatakan bahwa itu adalah itemset secara maksimal sering.
/199
One of the cornerstones of data mining is the development of association rules. Association rules greatest
impact is in helping to make decisions. One measure of the quality of an association rule is its relative
decision value. Association rules are often constructed using simplifying assumptions that lead to nave

results and consequently nave and often wrong decisions. Perhaps the greatest area of concern about
the decision value is treating association rules as causal statements without understanding whether there
is, in fact, underlying causality.
Salah satu pilar dari data mining adalah pengembangan aturan asosiasi. Aturan asosiasi dampak
terbesar adalah dalam membantu untuk membuat keputusan. Salah satu ukuran kualitas aturan asosiasi
adalah nilai keputusan relatifnya. Aturan asosiasi sering dibangun menggunakan asumsi
penyederhanaan yang menyebabkan na Ive hasil dan akibatnya na Ive dan keputusan sering salah.
Mungkin area terbesar kekhawatiran tentang nilai keputusan memperlakukan aturan asosiasi sebagai
pernyataan kausal tanpa memahami apakah ada, pada kenyataannya, yang mendasari kausalitas.
/213
At first glance, conditional and association rules seem to imply a causal or cause-effect relationship. That
is: A customers purchase of both sausage and beer causes the customer to also buy hamburger.
Sekilas, aturan kondisional dan asosiasi tampaknya menyiratkan hubungan kausal atau sebab-akibat.
Yaitu: Pembelian pelanggan dari kedua sosis dan bir menyebabkan pelanggan untuk juga membeli
hamburger.
/219
The most popular market basket association rule development method identifies rules of particular
interest by screening for joint probabilities (associations) above a specified threshold.
Pasar yang paling populer keranjang asosiasi aturan metode pengembangan mengidentifikasi aturan
kepentingan tertentu dengan skrining untuk probabilitas bersama (asosiasi) di atas ambang batas yang
ditetapkan.
/221
Association rules are used is to aid in making retail decisions. However, simple association rules may
lead to errors. Errors might occur; either if causality is recognized where there is no causality; or if the
direction of the causal relationship is wrong [18, 33]. Errors might occur; either if causality is recognized
where there is no causality; or if the direction of the causal relationship is wrong.
Aturan asosiasi yang digunakan adalah untuk membantu dalam membuat keputusan ritel. Namun,
asosiasi aturan sederhana dapat menyebabkan kesalahan. Kesalahan mungkin terjadi, baik jika
kausalitas diakui di mana ada kausalitas tidak ada, atau jika arah hubungan kausal yang salah [18, 33].
Kesalahan mungkin terjadi, baik jika kausalitas diakui di mana ada kausalitas tidak ada, atau jika arah
hubungan kausal yang salah.
/221
One of the corner stones of data mining is the development of association rules. Association rules
greatest impact is in helping to make decisions. One measure of the quality of an association rule is its
relative decision value. Association rules are often constructed using simplifying assumptions that lead to
nave results and consequently nave and often wrong decisions. Perhaps the greatest area of concern
is treating association rules as causal statements without understanding whether there is, in fact,
underlying causality.
Salah satu batu sudut data mining adalah pengembangan aturan asosiasi. Aturan asosiasi dampak
terbesar adalah dalam membantu untuk membuat keputusan. Salah satu ukuran kualitas aturan asosiasi
adalah nilai keputusan relatifnya. Aturan asosiasi sering dibangun menggunakan asumsi
penyederhanaan yang menyebabkan na Ive hasil dan akibatnya na Ive dan keputusan sering salah.
Mungkin area terbesar yang menjadi perhatian adalah memperlakukan aturan asosiasi sebagai
pernyataan kausal tanpa memahami apakah ada, pada kenyataannya, yang mendasari kausalitas.
/226
Data mining analyzes non-experimental data previously collected. There are several different data mining
products. The most common are conditional rules or association rules. Conditional rules are most often
drawn from induced trees while association rules are most often learned from tabular data.
Data mining menganalisis non-eksperimental data yang sebelumnya dikumpulkan. Ada beberapa data
yang berbeda produk pertambangan. Yang paling umum adalah aturan kondisional atau aturan asosiasi.

Aturan kondisional yang paling sering diambil dari pohon yang diinduksi sementara asosiasi aturan yang
paling sering dipelajari dari data tabular.
/241
This gives us only three data mining generalization operators to consider: classification, clustering, and
association.
Ini memberi kita hanya tiga operator Data generalisasi pertambangan untuk dipertimbangkan: klasifikasi,
clustering, dan asosiasi.
/476
Data mining includes a number of different tasks, such as association rule mining, classification, and
clustering, etc. This paper studies how to learn support vector machines.
Data mining mencakup sejumlah tugas yang berbeda, seperti pertambangan aturan asosiasi, klasifikasi,
dan clustering, dll ini mempelajari kertas cara belajar mesin dukungan vektor.
/518
JI [15] Data Mining, Foundations and Practice, Tsau Young Lin, Ying Xie, Anita Wasilewska, Churn-Jung
Liau, Springer, 2008.

Dong-Peng et al. described one such application where the implementations of decision trees and C.
Soares et al. / Applications of Data Mining in E-Business and Finance: Introduction 3 association rules in
WEKA [9] are applied in a risk analysis problem in banking, for which the data was suitably prepared [10].
Another example in this volume is the paper by Giuffrida et al., in which the Apriori algorithm for
association rule mining is used on an online advertising personalization problem [11].
Dong-Peng et al. dijelaskan satu aplikasi tersebut dimana implementasi dari pohon keputusan dan C.
Soares et al. / Aplikasi Data Mining dalam E-Business dan Keuangan: Pendahuluan 3 asosiasi aturan
dalam WEKA [9] diterapkan dalam analisis masalah risiko di perbankan, dimana data yang sesuai
dipersiapkan [10]. Contoh lain dalam buku ini adalah kertas oleh Giuffrida dkk, dimana algoritma Apriori
untuk association rule mining yang digunakan pada masalah personalisasi iklan online. [11].
/3
The applications cover tasks such as clustering (e.g., [15]), classification (e.g., [13,14]), regression (e.g.,
[6]), information retrieval (e.g., [8]) and extraction (e.g., [7]), association mining (e.g., [10,11]) and
sequence mining (e.g., [12,16]). Many research fields are also covered, including neural networks (e.g.,
[5]), machine learning (e.g., SVM [13]), data mining (e.g., association rules [10,11]), statistics (e.g., logistic
[13] and linear regression [6]) and evolutionary computation (e.g., [4,14]) The wider the range of tools that
is mastered by a data analyst, the better the results he/she may obtain.
Aplikasi mencakup tugas-tugas seperti clustering (misalnya, [15]), klasifikasi (misalnya, [13,14]), regresi
(misalnya, [6]), pencarian informasi (misalnya, [8]) dan ekstraksi (misalnya, [7]), asosiasi pertambangan
(misalnya, [10,11]) dan urutan pertambangan (misalnya, [12,16]). Banyak bidang penelitian juga dibahas,
termasuk jaringan saraf (misalnya, [5]), mesin belajar (misalnya, SVM [13]), data mining (misalnya,
asosiasi aturan [10,11]), statistik (misalnya, logistik [13 ] dan regresi [6 linier]) dan komputasi evolusioner
(misalnya, [4,14]) Semakin lebar berbagai alat yang dikuasai oleh seorang analis data, semakin baik hasil
yang ia / dia mungkin diperoleh.
/4
The purpose of association analysis is to figure out hidden associations and some useful rules contained
in the data base, and can use these rules to speculate and judge unknown data from the already known
information [6].
Tujuan dari analisis asosiasi adalah untuk mengetahui asosiasi tersembunyi dan beberapa aturan yang
berguna yang terkandung dalam basis data, dan dapat menggunakan aturan ini untuk berspekulasi dan
menilai data yang tidak diketahui dari informasi yang sudah dikenal [6].
/38

They propose a method to discover cyclic association rules. The same problem was also considered by
others, Verma and Vyas [5] propose an efficient algorithm to discover calendar-based association rules:
the rule egg coffee has a strong support in the early morning but much smaller support during the rest
of the day. Zimbrao et al. [6] extend the seasonality concept just mentioned to include also the concept of
product lifespan during rule generation and application.
Mereka mengusulkan sebuah metode untuk menemukan aturan siklik asosiasi. Masalah yang sama juga
dinilai oleh orang lain, Verma dan Vyas [5] mengusulkan algoritma yang efisien untuk menemukan
kalender berbasis aturan asosiasi: aturan "telur kopi" memiliki dukungan kuat di pagi hari namun
dukungan jauh lebih kecil selama sisanya hari. Zimbrao dkk. [6] memperluas konsep musiman hanya
disebutkan untuk menyertakan juga konsep produk jangka hidup selama pembangkitan rule dan aplikasi.
/53
JI [17] Applications of Data Mining in E-Business and Finance , Carlos Soares, Yonghong Peng, Jun
Meng, Takashi Washio, Zhi-Hua Zhou, The authors and IOS Press, 2008.
Association rules: Association rules with high confidence and support define a different kind of pattern. As
before, records that do not follow these rules are considered outliers. The power of association rules is
that they can deal with data of different types. However, Boolean association rules do not provide enough
quantitative and qualitative information. Ordinal association rules, defined by (Maletic and Marcus, 2000,
Marcus et al., 2001), are used to find rules that give more information (e.g., ordinal relationships between
data elements). The ordinal association rules yield special types of patterns, so this method is, in general,
similar to the pattern-based method. This method can be extended to find other kind of associations
between groups of data elements (e.g., statistical correlations).
Asosiasi aturan: aturan Asosiasi dengan keyakinan yang tinggi dan dukungan mendefinisikan berbagai
jenis pola. Seperti sebelumnya, catatan yang tidak mengikuti aturan ini dianggap outlier. Kekuatan aturan
asosiasi adalah bahwa mereka dapat menangani data dari berbagai jenis. Namun, Boolean asosiasi
aturan tidak memberikan informasi yang cukup kuantitatif dan kualitatif. Aturan asosiasi ordinal, yang
didefinisikan oleh (Maletic dan Marcus, 2000, Marcus dkk., 2001), digunakan untuk menemukan aturan
yang memberikan informasi lebih lanjut (misalnya, hubungan antara elemen data ordinal). Aturan
asosiasi ordinal menghasilkan jenis khusus dari pola, jadi metode ini, secara umum, mirip dengan
metode pola berbasis. Metode ini dapat diperpanjang untuk menemukan jenis lain dari hubungan antara
kelompok elemen data (misalnya, korelasi statistik).
/24
The term association rule was first introduced by (Aggarwal et al., 1993) in the context of market-basket
analysis. Association rule of this type are also referred to in the literature as classical or Boolean
association rules. The concept was extended in other studies and experiments. Of particular interest to
this research are the quantitative association rules (Srikant et al., 1996) and ratio-rules (Korn et al., 1998)
that can be used for the identification of possible erroneous data items with certain modifications.
In previous work we argued that another extension of the association rule ordinal association rules
(Maletic and Marcus, 2000, Marcus et al., 2001) is more flexible, general, and very useful for
identification of errors. Since this is a recently introduced concept, it is briefly defined.
Aturan asosiasi istilah pertama kali diperkenalkan oleh (Aggarwal et al, 1993.) Dalam konteks pasarkeranjang analisis. Asosiasi aturan jenis ini juga disebut dalam sastra sebagai aturan asosiasi klasik atau
Boolean. Konsep ini diperluas pada penelitian lain dan percobaan. Yang menarik untuk penelitian ini
adalah aturan asosiasi kuantitatif (Srikant et al., 1996) dan rasio-aturan (Korn et al., 1998) yang dapat
digunakan untuk identifikasi mungkin item data yang salah dengan modifikasi tertentu.
Dalam pekerjaan sebelumnya kita berpendapat bahwa perpanjangan aturan asosiasi - asosiasi ordinal
aturan (Maletic dan Marcus, 2000, Marcus et al, 2001.) - Lebih fleksibel, umum, dan sangat berguna
untuk identifikasi kesalahan. Karena ini adalah sebuah konsep baru ini diperkenalkan, sudah tersimpul
didefinisikan.
/26
The traditional application of association rules is market basket analysis, see for instance (Brijs et al.,
1999). Since then, the technique has been applied to other kinds of data, such as:

Census data (Brin et al., 1997A, Brin et al., 1997B)


Linguistic data for writer evaluation (Aumann and Lindell, 2003)
Insurance data (Castelo and Giudici, 2003)
Medical diagnosis (Gamberger et al., 1999)
One of the first generalizations, which has still applications in the field of market
basket analysis, is the consideration of temporal or sequential information, such as
the date of purchase. Applications include:
Market basket data (Agrawal and Srikant, 1995)
Causes of plan failures (Zaki, 2001)
Web personalization (Mobasher et al., 2002)
Text data (Brin et al., 1997A, Delgado et al., 2002)
Publication databases (Lee et al., 2001)
Aplikasi tradisional aturan asosiasi adalah analisis keranjang pasar, lihat misalnya (Brijs et al., 1999).
Sejak itu, teknik ini telah diterapkan untuk data jenis lain, seperti:
Data sensus (Brin et al, 1997a., Brin dkk., 1997b)
Linguistik data untuk evaluasi penulis (Aumann dan Lindell, 2003)
Asuransi data (Castelo dan Giudici, 2003)
Medis diagnosis (Gamberger et al., 1999)
Salah satu generalisasi pertama, di mana masih aplikasi di bidang pasar
analisis keranjang, adalah pertimbangan informasi temporal atau berurutan, seperti
tanggal pembelian. Aplikasi meliputi:
Data keranjang Pasar (Agrawal dan Srikant, 1995)
Penyebab kegagalan rencana (Zaki, 2001)
Web personalisasi (Mobasher et al., 2002)
Teks data (Brin et al, 1997a., Delgado et al., 2002)
Publikasi database (Lee et al., 2001)
/307
Association/Pattern defect recognition (Kim and Kumara, 1997)
Recognition facial image recognition (Dai and Nakano, 1998)
frequency assignment (Salcedo-Sanz et al., 2004)
graph or image matching (Suganthan et al., 1995; Pajares et al., 1998)
image restoration (Paik and Katsaggelos, 1992; Sun and Yu, 1995)
imgage segmentation (Rout et al., 1998; Wang et al., 1992)
landscape pattern prediction (Tatem et al., 2002)
market basket analysis (Evans, 1997)
object recognition (Huang and Liu, 1997; Young et al., 1997; Li and Lee, 2002)
on-line marketing (Changchien and Lu, 2001)
pattern sequence recognition (Lee, 2002)
semantic indexing and searching (Chen et al., 1998)
Asosiasi / Pola cacat pengakuan (Kim dan Kumara, 1997)
Pengenalan wajah gambar pengakuan (Dai dan Nakano, 1998)
frekuensi penugasan (Salcedo-Sanz et al., 2004)
grafik atau gambar pencocokan (Suganthan et al, 1995;.. Pajares et al, 1998)
gambar restorasi (Paik dan Katsaggelos, 1992; Sun dan Yu, 1995)
imgage segmentasi (Rout et al, 1998;.. Wang et al, 1992)
lanskap pola prediksi (Tatem et al., 2002)
market basket analisis (Evans, 1997)
objek pengakuan (Huang dan Liu, 1997; muda et al, 1997;. Li dan Lee, 2002)
on-line pemasaran (Changchien dan Lu, 2001)
pola urutan pengakuan (Lee, 2002)
semantik pengindeksan dan pencarian (Chen et al., 1998)
/437
Data Mining, as presently understood, is a broad term, including search for association rules,
classification, regression, clustering and similar. Here we shall restrict ourselves to search for rules in a

rather general sense, namely general dependencies valid in given data and expressed by formulas of a
formal logical language.
Data Mining, seperti saat ini dipahami, adalah istilah yang luas, termasuk mencari "aturan asosiasi",
klasifikasi, regresi, clustering dan serupa. Di sini kita harus membatasi diri untuk mencari "aturan" dalam
arti yang agak umum, yaitu dependensi umum berlaku dalam data yang diberikan dan dinyatakan oleh
rumus bahasa logis formal.
/541
Data Mining is mainly concerned with methodologies for extracting patterns from large data repositories.
There are many Data Mining methods which accomplishing a limited set of tasks produces a particular
enumeration of patterns over data sets. The main tasks of Data Mining which have already been
discussed in previous sections are: i) Clustering, ii) Classification, iii) Association Rule Extraction, iv)Time
Series, v) Regression, and vi) Summarization.
Data Mining ini terutama berkaitan dengan metodologi untuk mengekstraksi pola dari repositori data yang
besar. Ada beberapa metode Pertambangan banyak Data yang mencapai seperangkat terbatas tugas
menghasilkan enumerasi tertentu pola lebih set data. Tugas utama Data Mining yang telah dibahas
dalam bagian sebelumnya adalah: i) Clustering, ii) Klasifikasi, iii) Asosiasi Peraturan Ekstraksi, iv) Time
Series, v) Regresi, dan vi) Summarization.
/613
There are also some other well-known approaches and measures for evaluating association rules are:
Rule templates are used to describe a pattern for those attributes that can appear in the left- or righthand side of an association rule. A rule template may be either inclusive or restrictive. An inclusive rule
template specifies desirable rules that are considered to be interesting. On the other hand a restrictive
rule template specifies undesirable rules that are considered to be uninteresting. Rule pruning can be
done by setting support, confidence and rule size thresholds.
Dong and Lis interestingness measure (Dong and Li, 1998) is used to evaluate the importance of an
association rule by considering its unexpectedness in terms of other association rules in its neighborhood.
The neighborhood of an association rule consists of association rules within a given distance.
Gray and Orlowskas Interestingness (Gray and Orlowka, 1998) to evaluate the confidence of
associations between sets of items in the extracted association rules. Though suppor and confidence
have been shown to be useful for characterizing association rules, interestingness contains a
discriminator component that gives an indication of the independence of the antecedent and consequent.
Peculiarity (Zhong et al., 1999) is a distance-based measure of rules interestingness. It is used to
determine the extent to which one data object differs from other similar data objects.
Closed Association Rules Mining. It is widely recognized that the larger the set of frequent itemsets, the
more association rules are presented to the user, many of which turn out to be redundant. However it is
not necessary to mine all frequent itemsets to guarantee that all non-redundant association rules will be
found. It is sufficient to consider only the closed frequent itemsets (Zaki and Hsiao, 2002, Pasquier et al.,
1999, Pei et al., 2000). The set of closed frequent itemsets can guarantee completeness even in dense
domains and all non-redundant association rules can be defined on it. CHARM is an efficient algorithm for
closed association rules mining.
Ada juga beberapa yang terkenal lainnya pendekatan dan langkah-langkah untuk mengevaluasi aturan
asosiasi adalah:
Peraturan template yang digunakan untuk menggambarkan sebuah pola untuk atribut-atribut yang
dapat muncul di sisi kiri atau kanan dari aturan asosiasi. Sebuah template aturan dapat berupa inklusif
atau membatasi. Template aturan inklusif menetapkan aturan diinginkan yang dianggap menarik. Di sisi
lain template aturan ketat menetapkan aturan yang tidak diinginkan yang dianggap tidak menarik. Aturan
pemangkasan dapat dilakukan dengan menetapkan ambang batas dukungan, kepercayaan dan aturan
ukuran.
Dong dan ukuran interestingness Li (Dong dan Li, 1998) digunakan untuk mengevaluasi pentingnya
aturan asosiasi dengan mempertimbangkan terduga dalam hal aturan asosiasi lain di sekitarnya.
Lingkungan dari aturan asosiasi terdiri dari aturan asosiasi dalam jarak tertentu.
Gray dan Interestingness Orlowska ini (Gray dan Orlowka, 1998) untuk mengevaluasi keyakinan
asosiasi antara set item dalam aturan asosiasi diekstraksi. Meskipun Suppor dan keyakinan telah terbukti

berguna untuk karakteristik aturan asosiasi, interestingness mengandung komponen diskriminator yang
memberikan indikasi kemerdekaan anteseden dan konsekuen.
keganjilan (Zhong dkk., 1999) adalah ukuran jarak berbasis interestingness aturan. Hal ini digunakan
untuk menentukan sejauh mana satu data objek berbeda dari yang lain objek data yang sama.
Tertutup Asosiasi Aturan Pertambangan. Diakui secara luas bahwa semakin besar himpunan itemset
sering, asosiasi lebih aturan disajikan kepada pengguna, banyak yang berubah menjadi berlebihan.
Namun tidak perlu untuk menambang semua itemset yang sering untuk menjamin bahwa semua nonredundant asosiasi aturan akan ditemukan. Hal ini cukup untuk mempertimbangkan hanya itemset sering
tertutup (Zaki dan Hsiao, 2002, Pasquier et al, 1999., Pei dkk., 2000). Himpunan itemset sering tertutup
dapat menjamin kelengkapan bahkan di domain padat dan semua non-redundant asosiasi aturan dapat
didefinisikan di atasnya. CHARM merupakan algoritma yang efisien untuk aturan pertambangan tertutup
asosiasi.
/623
Rare cases are often of special interest. This is especially true in the context of Data Mining, where one
often wants to uncover subtle patterns that may be hidden in massive amounts of data. Examples of
mining rare cases include learning word pronunciations (Van den Bosch et al., 1997), detecting oil spills
from satellite images (Kubat et al., 1998), predicting telecommunication equipment failures (Weiss and
Hirsh, 1998) and finding associations between infrequently purchased supermarket items (Liu et al.,
1999). Rare cases warrant special attention because they pose significant problems for Data Mining
algorithms.
Kasus yang jarang sering minat khusus. Hal ini terutama berlaku dalam konteks Data Mining, di mana
orang sering ingin menemukan pola yang halus yang mungkin tersembunyi di sejumlah besar data.
Contoh kasus pertambangan langka termasuk lafal kata belajar (Van den Bosch et al, 1997.), Mendeteksi
tumpahan minyak dari citra satelit (Kubat et al., 1998), kegagalan telekomunikasi memprediksi peralatan
(Weiss dan Hirsh, 1998) dan asosiasi menemukan antara jarang dibeli supermarket semuanya (Liu et al.,
1999). Kasus yang jarang memerlukan perhatian khusus karena mereka menimbulkan masalah yang
signifikan untuk algoritma data mining.
/747
The three rare cases will be more difficult to detect and generalize from because they contain fewer data
points. A second important unsupervised learning task is association rule mining, which looks for
associations between items (Agarwal et al., 1993).
Groupings of items that co-occur frequently, such as milk and cookies, will be considered common cases,
while other associations may be extremely rare. For example, mop and broom will be a rare association
(i.e., case) in the context of supermarket sales, not because the items are unlikely to be purchased
together, but because neither item is frequently purchased in a supermarket (Liu et al., 1999).
Tiga kasus yang jarang terjadi akan lebih sulit untuk mendeteksi dan generalisasi dari karena
mengandung titik data yang lebih sedikit. Sebuah tugas penting pembelajaran tanpa pengawasan kedua
adalah asosiasi aturan pertambangan, yang mencari asosiasi antar item (Agarwal et al., 1993).
Pengelompokan item yang co-sering terjadi, seperti susu dan cookie, akan dianggap kasus umum,
sementara asosiasi lain mungkin sangat jarang. Misalnya, pel dan sapu akan menjadi asosiasi jarang
(yaitu, kasus) dalam konteks penjualan supermarket, bukan karena item yang tidak mungkin dibeli
bersama, tapi karena item tidak sering dibeli di supermarket (Liu et al. 1999).
/748
JI [18] Data Mining and Knowledge Discovery Handbook, Oded Maimon, Lior Rokach, Springer, 2nd,
2010.
The three main areas of data mining are (a) classification, (b) clustering, and (c) association rule mining
(Dunham, 2003). A brief review is given of the methods discussed in this article.
Tiga bidang utama dari data mining adalah (a) klasifikasi, (b) clustering, dan (c) aturan asosiasi
pertambangan (Dunham, 2003). Sebuah tinjauan singkat diberikan dari metode yang dibahas dalam
artikel ini.
/7

Association rule mining (ARM) considers marketbasket or shopping-cart data, that is, the items
purchased on a particular visit to the supermarket. ARM first determines the frequent sets, which have to
meet a certain support level.
Asosiasi pertambangan aturan - (ARM) menganggap data yang marketbasket atau belanja-belanja, yaitu
barang yang dibeli pada kunjungan khusus ke supermarket. ARM pertama menentukan set sering, yang
harus memenuhi tingkat dukungan tertentu.
/7
Association Rules: Used to associate items in a database sharing some relationship (e.g., co-purchase
information). Often takes the for if this, then that, such as, If the customer buys a handheld videogame
then the customer is likely to purchase batteries.
Aturan Asosiasi: Digunakan untuk menghubungkan item dalam database berbagi beberapa hubungan
(misalnya, co-beli informasi). Sering mengambil untuk "jika ini, maka itu," seperti, "Jika pelanggan
membeli videogame genggam maka pelanggan cenderung membeli baterai."
/48
Association Rule Mining (ARM) is concerned with how items in a transactional database are grouped
together. It is commonly known as market basket analysis, because it can be likened to the analysis of
items that are frequently put together in a basket by shoppers in a market.
Asosiasi Peraturan Pertambangan (ARM) berkaitan dengan bagaimana item dalam database
transaksional dikelompokkan bersama. Hal ini umumnya dikenal sebagai analisis market basket, karena
dapat disamakan dengan analisis item yang sering disatukan dalam keranjang oleh pembeli di pasar.
/59
Association rule mining (Agrawal, Imilienski, & Swami, 1993) has been proposed for understanding the
relationships among items in transactions or market baskets. For instance, if a customer buys butter, what
is the chance that he/she buys bread at the same time? Such information may be useful for decision
makers to determine strategies in a store.
Asosiasi aturan pertambangan (Agrawal, Imilienski, & Swami, 1993) telah diusulkan untuk memahami
hubungan antar item dalam transaksi atau keranjang pasar. Misalnya, jika seorang pelanggan membeli
mentega, apa kemungkinan dia / dia membeli roti pada waktu yang sama? Informasi tersebut mungkin
berguna bagi para pengambil keputusan untuk menentukan strategi di sebuah toko.
/65
Association rules, introduced by Agrawal, Imielinski and Swami (1993), provide useful means to discover
associations in data. The problem of mining association rules in a database is defined as finding all the
association rules that hold with more than a user-given minimum support threshold and a user-given
minimum confidence threshold. According to Agrawal, Imielinski and Swami, this problem is solved in two
steps:
Aturan asosiasi, yang diperkenalkan oleh Agrawal, Imielinski dan Swami (1993), menyediakan sarana
yang berguna untuk menemukan asosiasi dalam data. Masalah pertambangan aturan asosiasi dalam
database didefinisikan sebagai menemukan semua aturan asosiasi yang memegang dengan lebih dari
batas minimum user-diberikan dukungan dan pengguna yang diberikan ambang kepercayaan minimum.
Menurut Agrawal, Imielinski dan Swami, masalah ini diselesaikan dalam dua langkah:
1. Find all frequent itemsets in the database.
2. For each frequent itemset I, generate all the association
rules I'I\I', where I'I.
1. Cari semua itemset sering di database.
2. Untuk setiap frequent itemset I, menghasilkan semua asosiasi
aturan saya saya \ saya, di mana saya I.
/150
Association Rule: A pair of frequent itemsets (A, B), where the ratio between the support of AB and A
itemsets is greater than a predefined threshold, denoted minconf.
Asosiasi Peraturan: Sepasang itemset sering (A, B), dimana rasio antara dukungan A B dan A itemset
lebih besar dari ambang batas yang telah ditetapkan, minconf dilambangkan.

/153
Association Rule: A rule in the form of if this, then that. It states a statistical correlation between the
occurrence of certain attributes in a database.
Asosiasi Aturan: Aturan dalam bentuk ". Apakah ini, maka" Ini menyatakan korelasi statistik antara
terjadinya atribut tertentu dalam database.
/164

/233

/233
Association rule is a type of data mining that correlates one set of items or events with another set of
items or events. It employs association or linkage analysis, searching transactions from operational
systems for interesting patterns with a high probability of repetition

Asosiasi aturan adalah jenis data mining yang berkorelasi satu set item atau peristiwa dengan satu set
item atau peristiwa. Ini mempekerjakan asosiasi atau analisis keterkaitan, mencari transaksi dari sistem
operasional untuk pola yang menarik dengan probabilitas tinggi pengulangan
/272

/493
JI [19] Data Mining Techniques for the Life Science, Oliviero Carugo, Frank Eisenhaber, Humana Press,
Springer, 2010.

You might also like