Welcome to Scribd!

Skip carousel

Data Mining-Rule Based Classification

Uploaded by

Raj Endran

0% found this document useful (0 votes)

287 views4 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Data Mining-Rule Based Classification

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

287 views4 pages

Data Mining-Rule Based Classification

Uploaded by

Raj Endran

Data Mining-Rule Based Classification

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 4

Search inside document

RULE BASED CLASSIFICATION

Rule-Based Classification
Model Rules
Set of IF-THEN rules
IF age = youth AND student = yes THEN
buys_computer = yes
Rule antecedent/precondition vs. rule consequent
Assessment of a rule: coverage and accuracy
ncovers = # of tuples covered by R
ncorrect = # of tuples correctly classified by R
coverage(R) = ncovers /|D| /* D: training data set
*/
accuracy(R) = ncorrect / ncovers
Rule Accuracy and Coverage
If-Then Rules
Rule Triggering
Input X satisfies a rule
Several rules are triggered Conflict Resolution
Size Ordering

Highest priority to toughest (rule antecedent

size) rule
Rule Ordering

Rules are prioritized before-hand

Class based ordering

Rules for most prevalent class comes first
or based on mis-classification cost / class

Rule-based ordering
Rule Quality based measures
Ordered list Decision list Must be
processed strictly in order
No rule is triggered Default rule

Rule Extraction from a Decision Tree

Example: Rule extraction from the buys_computer

decision-tree
IF age = young AND student = no THEN
buys_computer = no
IF age = young AND student = yes THEN
buys_computer = yes
IF age = mid-age THEN buys_computer = yes
IF age = old AND credit_rating = excellent THEN
buys_computer = yes
IF age = young AND credit_rating = fair THEN
buys_computer = no
Set of extracted rules very high
Pruning may be required
Rule Generalization For a given rule
antecedent any condition that does not improve
the estimated accuracy can be dropped
Side-effects of pruning

Mutually Exclusive? / Exhaustive?

C4.5 Class Ordering for Conflict resolution

All rules for a single class are grouped

together

Class rule sets are ranked to minimize falsepositive errors

Default class one that contains most training

tuples not covered by any rule
Rule Extraction from the Training Data

Sequential covering algorithm: Extracts rules

directly from training data
Associative Classification Algorithms may also

be used

Typical sequential covering algorithms: FOIL (First

Order Inductive Learner), AQ, CN2, RIPPER

Rules are learned sequentially, each rule for a given
class Ci will cover many tuples of Ci but none (or
few) of the tuples of other classes
Steps:

Rules are learned one at a time

Each time a rule is learned, the tuples covered by

the rules are removed

The process repeats on the remaining tuples

unless termination condition, e.g., when no more
training examples or when the quality of a rule
returned is below a user-specified threshold
Algorithm: Sequential Covering
Input: D, Att_vals
Output: If-Then rules
Method:
Rule_set = {}
For each class c do
Repeat
Rule = Learn_One_Rule(D, Att_vals, c) //
Finds best rule for given class
Remove tuples covered by Rule from D
Until terminating condition
Rule_set = Rule_set + Rule
End for
Return Rule_Set

Start with the most general rule possible: condition =

empty
Adding new attributes by adopting a greedy depthfirst strategy
Picks the one that most improves the rule quality

Example:
Start with IF _ THEN loan_decision = accept
Consider IF loan_term=short THEN.. / IF
loan_term=long THEN.. / IF income = high
THEN.. / IF income = medium THEN.. /
If best one is IF income = high THEN
loan_decision = accept expand it further

Rule Quality measures

Coverage or Accuracy independently will not be
sufficient
Rule-Quality measures: consider both coverage and
accuracy
Foil-gain (in FOIL & RIPPER): assesses
info_gain by extending condition

It favors rules that have high accuracy and cover

many positive tuples
R Existing rule; R Extended rule
Likelihood Ratio Statistic
m
Likelihood_Ratio = 2 i=1
fi log(fi/ei)
Greater this value higher the significance
Rule pruning based on an independent set of test
tuples
Pos/neg are # of positive/negative tuples covered
by R.
If FOIL_Prune is higher for the pruned version of
R, prune R

Measurement - Drill Sheets Gr. 3-5
From Everand
Measurement - Drill Sheets Gr. 3-5
Chris Forest
No ratings yet
Rule Based Classification
Document2 pages
Rule Based Classification
Deepesh
No ratings yet
IME672 - Lecture 48
Document21 pages
IME672 - Lecture 48
Himanshu Beniwal
No ratings yet
Chapter 4: Classification & Prediction
Document54 pages
Chapter 4: Classification & Prediction
Ronak Patel
100% (1)
Data Mining - Rule Based Classification 2
Document1 page
Data Mining - Rule Based Classification 2
Sajid Bhatt
No ratings yet
DM 04 04 Rule-Based Classification
Document72 pages
DM 04 04 Rule-Based Classification
Mohamad Arif
No ratings yet
DM - 05 - 04 - Rule-Based Classification PDF
Document72 pages
DM - 05 - 04 - Rule-Based Classification PDF
Mohamad Arif
No ratings yet
Data Mining - Rule Based Classification
Document3 pages
Data Mining - Rule Based Classification
Dr B Anjanadevi
No ratings yet
Concepts and Techniques: Data Mining
Document17 pages
Concepts and Techniques: Data Mining
Hafizur Rahman Dhrubo
No ratings yet
ML UNIT-3 Notes PDF
Document23 pages
ML UNIT-3 Notes PDF
Anil Krishna
No ratings yet
SE-6104 Data Mining and Analytics: Lecture # 12 Rule Based Classification
Document62 pages
SE-6104 Data Mining and Analytics: Lecture # 12 Rule Based Classification
Huma Qayyum MohyudDin
No ratings yet
Rule Based Classification: Dr. Senthilkumar N C, Asso Prof, SITE 1
Document17 pages
Rule Based Classification: Dr. Senthilkumar N C, Asso Prof, SITE 1
Lilly Singh
No ratings yet
DWDM Unit-3: What Is Classification? What Is Prediction?
Document12 pages
DWDM Unit-3: What Is Classification? What Is Prediction?
Sai Venkat Gudla
No ratings yet
Question: What Are The Basic Building Blocks of Learning Agent? Explain Each of Them With A Neat Block Diagram
Document15 pages
Question: What Are The Basic Building Blocks of Learning Agent? Explain Each of Them With A Neat Block Diagram
roshankoju
No ratings yet
Chapter 4
Document31 pages
Chapter 4
Bikila Seketa
No ratings yet
Q-Learning and Dynamic Treatment Regimes: S.A. Murphy Univ. of Michigan IMS/Bernoulli: July, 2004
Document31 pages
Q-Learning and Dynamic Treatment Regimes: S.A. Murphy Univ. of Michigan IMS/Bernoulli: July, 2004
warezisgr8
No ratings yet
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Document32 pages
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Rule2
No ratings yet
Machine Learning For Data Science
Document20 pages
Machine Learning For Data Science
praveenakg
No ratings yet
Structural Learning Theory (J. Scandura) : Overview
Document2 pages
Structural Learning Theory (J. Scandura) : Overview
Maria Gie
No ratings yet
Machine Learning Functionalities
Document58 pages
Machine Learning Functionalities
Rashi Agarwal
No ratings yet
DM Module-3 Notes
Document25 pages
DM Module-3 Notes
Hrithik Kumar
No ratings yet
NLP Chapter 2
Document79 pages
NLP Chapter 2
ai20152023
No ratings yet
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Document40 pages
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Thịnh Thái
No ratings yet
Generating A Urate Rule Sets Without Global Optimization: Abstrac T
Document8 pages
Generating A Urate Rule Sets Without Global Optimization: Abstrac T
MIller
No ratings yet
MB0048 - Operations Research
Document10 pages
MB0048 - Operations Research
deepmaniar
No ratings yet
Machine Learning Mod 5
Document15 pages
Machine Learning Mod 5
Vishnu Ch
No ratings yet
Classification Problems
Document53 pages
Classification Problems
Naveen Jaishankar
No ratings yet
Data Mining - Credibility: Evaluating What's Been Learned
Document36 pages
Data Mining - Credibility: Evaluating What's Been Learned
sebastian quintero
No ratings yet
A1579305753 - 23783 - 8 - 2019 - Machine Learning
Document18 pages
A1579305753 - 23783 - 8 - 2019 - Machine Learning
Maheswari Chimata
No ratings yet
10: Advice For Applying Machine Learning: Deciding What To Try Next
Document8 pages
10: Advice For Applying Machine Learning: Deciding What To Try Next
marc
No ratings yet
AI Lec-Module-III
Document102 pages
AI Lec-Module-III
himadeepthi sayani
No ratings yet
For Unit 4 Useful
Document107 pages
For Unit 4 Useful
shilpa dirisala
No ratings yet
Classification and Prediction: Data Mining 이복주 단국대학교 컴퓨터공학과
Document75 pages
Classification and Prediction: Data Mining 이복주 단국대학교 컴퓨터공학과
Rooplata Nayak
No ratings yet
Lesson 2
Document4 pages
Lesson 2
mohammadsadaf
No ratings yet
Introduction To Expert Systems
Document7 pages
Introduction To Expert Systems
Mariane Warui Gathoni
No ratings yet
Unit Iv
Document38 pages
Unit Iv
Vasantha Kumar V
No ratings yet
3-Classification, Clustering and Prediction
Document142 pages
3-Classification, Clustering and Prediction
Barsha Roy
No ratings yet
What Is Classification? What Is Prediction?
Document21 pages
What Is Classification? What Is Prediction?
Hit Man
No ratings yet
Assessment: Center of Excellence For Teacher Education
Document7 pages
Assessment: Center of Excellence For Teacher Education
Wyzty Delle
No ratings yet
Classification and Prediction
Document41 pages
Classification and Prediction
kolluriniteesh111
No ratings yet
DWDM Unit 4
Document22 pages
DWDM Unit 4
Vanshika Chauhan
No ratings yet
Writing Application and Analysis Test Questions: AST Instructors Forum February 22, 2014
Document38 pages
Writing Application and Analysis Test Questions: AST Instructors Forum February 22, 2014
John Miler
No ratings yet
Homework # 2 - CYS 607: Submission Date: 24-03-21 Total Marks: 10
Document4 pages
Homework # 2 - CYS 607: Submission Date: 24-03-21 Total Marks: 10
wejdan alharbi
No ratings yet
DM Chapter 4
Document47 pages
DM Chapter 4
world channel
No ratings yet
AI Unit 4 QA
Document22 pages
AI Unit 4 QA
HOW to BASIC INDIAN
No ratings yet
PsychAss Chapter 7
Document5 pages
PsychAss Chapter 7
Adam Vida
No ratings yet
Machine Learning
Document6 pages
Machine Learning
Sushmita Mhamane
No ratings yet
Bilal Ahmed Shaik Data Mining
Document88 pages
Bilal Ahmed Shaik Data Mining
Shaik Bilal Ahmed
No ratings yet
Lesson 8. Assignment PDF
Document2 pages
Lesson 8. Assignment PDF
Monkey Business
No ratings yet
Expert Systems
Document20 pages
Expert Systems
Champa Bopegama
No ratings yet
As Physics Coursework Materials
Document6 pages
As Physics Coursework Materials
f5a1eam9
100% (2)
Table of Specification
Document8 pages
Table of Specification
Contagious Obsessions Affiliate
No ratings yet
DT-0 (3 Files Merged)
Document143 pages
DT-0 (3 Files Merged)
Qasim Abid
No ratings yet
Judy Ann D. Pammalay EDUC - 13 Beed 4-A: Grading
Document2 pages
Judy Ann D. Pammalay EDUC - 13 Beed 4-A: Grading
JD Macalindong
No ratings yet
3.3. Case-Based Reasoning (CBR) : Ian F. C. Smith EPFL, Switzerland
Document32 pages
3.3. Case-Based Reasoning (CBR) : Ian F. C. Smith EPFL, Switzerland
varunsingh214761
No ratings yet
Module 3
Document64 pages
Module 3
Abhishek Chandrasenan Nair
No ratings yet
TAG Strategy For This Lesson:: Graduated Difficulty
Document11 pages
TAG Strategy For This Lesson:: Graduated Difficulty
api-361030663
No ratings yet
ML Unit 3 Part 3
Document33 pages
ML Unit 3 Part 3
jkdprince3
No ratings yet
What Is Reinforcement Learning
Document12 pages
What Is Reinforcement Learning
ranamzeeshan
No ratings yet
Characteristics of A Good Test
Document23 pages
Characteristics of A Good Test
Boyet Aluan
No ratings yet
Data Mining - Mining Sequential Patterns
Document10 pages
Data Mining - Mining Sequential Patterns
Raj Endran
No ratings yet
Data Mining-Mining Sequence Patterns in Biological Data
Document6 pages
Data Mining-Mining Sequence Patterns in Biological Data
Raj Endran
No ratings yet
Data Mining-Graph Mining
Document9 pages
Data Mining-Graph Mining
Raj Endran
No ratings yet
Data Mining-Spatial Data Mining
Document8 pages
Data Mining-Spatial Data Mining
Raj Endran
No ratings yet
Data Mining-Outlier Analysis
Document6 pages
Data Mining-Outlier Analysis
Raj Endran
No ratings yet
5.1 Mining Data Streams
Document16 pages
5.1 Mining Data Streams
Raj Endran
No ratings yet
Data Mining-Mining Time Series Data
Document7 pages
Data Mining-Mining Time Series Data
Raj Endran
No ratings yet
Data Mining-Partitioning Methods
Document7 pages
Data Mining-Partitioning Methods
Raj Endran
100% (1)
Data Mining-Multimedia Datamining
Document8 pages
Data Mining-Multimedia Datamining
Raj Endran
No ratings yet
Data Mining - Other Classifiers
Document7 pages
Data Mining - Other Classifiers
Raj Endran
No ratings yet
Data Mining-Model Based Clustering
Document8 pages
Data Mining-Model Based Clustering
Raj Endran
No ratings yet
Data Mining-Constraint Based Cluster Analysis
Document4 pages
Data Mining-Constraint Based Cluster Analysis
Raj Endran
100% (1)
Data Mining-Support Vector Machines and Associative Classifiers Revised
Document4 pages
Data Mining-Support Vector Machines and Associative Classifiers Revised
Raj Endran
No ratings yet
Data Mining - Data Reduction
Document6 pages
Data Mining - Data Reduction
Raj Endran
No ratings yet
Data Mining - Discretization
Document5 pages
Data Mining - Discretization
Raj Endran
No ratings yet
Data Mining - Bayesian Classification
Document6 pages
Data Mining - Bayesian Classification
Raj Endran
No ratings yet
Data Mining-Backpropagation
Document5 pages
Data Mining-Backpropagation
Raj Endran
100% (1)
Data Mining - Density Based Clustering
Document8 pages
Data Mining - Density Based Clustering
Raj Endran
No ratings yet
Data Mining-Applications, Issues
Document9 pages
Data Mining-Applications, Issues
Raj Endran
No ratings yet
02 Data Mining-Partitioning Method
Document8 pages
02 Data Mining-Partitioning Method
Raj Endran
No ratings yet
Data Mining-Data Warehouse
Document7 pages
Data Mining-Data Warehouse
Raj Endran
No ratings yet
08 Data Mining-Other Classifications
Document4 pages
08 Data Mining-Other Classifications
Raj Endran
No ratings yet
Data Mining - Outlier Analysis
Document11 pages
Data Mining - Outlier Analysis
Raj Endran
100% (2)
Topic: Difference Between: Inferential Research, Unlike Descriptive
Document2 pages
Topic: Difference Between: Inferential Research, Unlike Descriptive
Eric Casanas
No ratings yet
Neuron Lesson Loeblein
Document2 pages
Neuron Lesson Loeblein
CoacytTucuman
No ratings yet
Senior Accountant Auditor MBA in Houston TX Resume Rochelle Butler
Document3 pages
Senior Accountant Auditor MBA in Houston TX Resume Rochelle Butler
RochelleButler
No ratings yet
Command-Words-All 3 Levels
Document11 pages
Command-Words-All 3 Levels
Senumi Fonseka
100% (1)
Article Organizational Culture Study
Document27 pages
Article Organizational Culture Study
Sergio Luis Smidt
No ratings yet
Dzongsar Jamyang Khyentse Rinpoche On "ADVICE ON NGONDRO" (Rio de Janeiro, 2008) Transcibed From Podcast.
Document20 pages
Dzongsar Jamyang Khyentse Rinpoche On "ADVICE ON NGONDRO" (Rio de Janeiro, 2008) Transcibed From Podcast.
Teong Hin Ooi
100% (2)
DLL Level 3 - 4th Quarter WEEK-1
Document3 pages
DLL Level 3 - 4th Quarter WEEK-1
Johaira Acot
No ratings yet
Prospectus: FOR Short Term Educational Courses
Document15 pages
Prospectus: FOR Short Term Educational Courses
Shabbir Anjum
No ratings yet
The Effect of Relationship Marketing On Customer Retention
Document15 pages
The Effect of Relationship Marketing On Customer Retention
Irfan Fatur Rahman
No ratings yet
Writing A 10 Page Research Paper
Document8 pages
Writing A 10 Page Research Paper
tuigauund
100% (1)
Personal Succes Program - Self-Scoring Aptitude Test - Joseph Speicher
Document14 pages
Personal Succes Program - Self-Scoring Aptitude Test - Joseph Speicher
Andreea Virtej
No ratings yet
Template For Opcrf of School Heads 1
Document29 pages
Template For Opcrf of School Heads 1
Mark San Andres
100% (1)
Chapter5 Casestudy
Document4 pages
Chapter5 Casestudy
Arbindchaudhary
No ratings yet
Universiti Teknologi Mara - Examination Result
Document1 page
Universiti Teknologi Mara - Examination Result
AFIQ ASHRAF ABD RAHIM
No ratings yet
Potch Girls High Newsletter 3
Document2 pages
Potch Girls High Newsletter 3
madsdaly
No ratings yet
BBA Internship Report Contents
Document3 pages
BBA Internship Report Contents
Usama Tahir
No ratings yet
11 Chap - 4 PDF
Document29 pages
11 Chap - 4 PDF
Shreshtha Aditya
No ratings yet
Nursing Program at Langara
Document6 pages
Nursing Program at Langara
Hardeesh
No ratings yet
Reflection On Benchmarking School Visit To
Document3 pages
Reflection On Benchmarking School Visit To
nashamalina
0% (1)
Drama A Tool For Learning
Document6 pages
Drama A Tool For Learning
Ayu Tri Lestari
No ratings yet
NIFT MFM Question Paper
Document60 pages
NIFT MFM Question Paper
Abhishek Singhal
No ratings yet
The Facial Expression of Pain: Focus
Document10 pages
The Facial Expression of Pain: Focus
Natsumi Sawada
No ratings yet
University of Cambridge International Examinations International General Certificate of Secondary Education
Document20 pages
University of Cambridge International Examinations International General Certificate of Secondary Education
Ye
No ratings yet
Marian Bradshaw's Resume
Document2 pages
Marian Bradshaw's Resume
Marian
No ratings yet
ADVT. NO.: 41/2014 Recruitment For The Position of "Project Fellow" Under Funded Project
Document2 pages
ADVT. NO.: 41/2014 Recruitment For The Position of "Project Fellow" Under Funded Project
Jeshi
No ratings yet
Matrix Table
Document5 pages
Matrix Table
Merald Melton
No ratings yet
1997 - Shaughnessy 1997
Document17 pages
1997 - Shaughnessy 1997
Nathalia Morgado Hdz
No ratings yet
Clinical Guidelines Procedures PDF
Document134 pages
Clinical Guidelines Procedures PDF
Júlio Zoé
No ratings yet
Grade: Subject: Focus:: Loud Soft
Document2 pages
Grade: Subject: Focus:: Loud Soft
Diana Fox
No ratings yet