Welcome to Scribd!

Skip carousel

BMI 704 - Machine Learning Lab

Uploaded by

jakekei5258

0% found this document useful (0 votes)

29 views23 pages

machine learning lab session

Original Title

BMI704_ML_Lab 030719 v2

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

machine learning lab session

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

29 views23 pages

BMI 704 - Machine Learning Lab

Uploaded by

jakekei5258

machine learning lab session

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 23

Search inside document

BMI 704 – Machine Learning

Lab
030719
Topics
• Introduction to Supervised Learning
• Introduction to Unsupervised Learning

• Algorithms and Packages

Supervised Learning
• Outcome
• You know the outcome (labelled variables; Y)
Your model
• Continuous or binary

• Features
• i.e. variables (Xs)
• Inputs you are using to predict outcome

• Model Models
• 1) Pick a guy Diabetes = 0.5*age + 0.2*sex + 2.1*BMI + …
• 2) sub his features into the model
Height = 0.2*age + 0.8*sex + 1.3*weight + …
• 3) now you know his outcome
Where is the predicting model come from?
• 1) Pick an algorithm
• Linear model
• Y = X1 + X2 + X3

• 2) Split your data set into train and test (e.g. 80/20,
70/30)

• 3) Build your model using the training data set

• Cross validation find best model parameters

• 4) Run your optimized model using the test data set

• 5) Report model performance and your results

Measurement of how well your algorithm did?
Loss function
• Objective metric, max or
min

Simple Regression
• R2 - amount of variance
explained

Multiple regression with

varying model size
• Adjusted R2
• AIC/BIC/Cp
Measurement of how well your algorithm did?
Classification (Y = binary)
• Receiver operating
characteristic (ROC) curve
and area under the curve
(AUC)

• If Y = 1 or 0;
• High sensitivity:
• Y = 1; ➙ Y^ = 1
• High specificity:
• Y = 0; ➙ Y^ = 0
Which model (algorithm) should you use?
Unsupervised Learning
• Not interest in predicting Y but exploratory analysis (Xs)
• discovering patterns
• Find subgroups that you don’t know
• Visualize the results

• Hard to validate results

• Principle component analysis

• X1, X2, X3, X4 … Xn
• ➙ create latent variables (PCs)

• A few latent variables to capture the most of the information of the data
• i.e. the variance explained

• Variance explained: PC1 > PC2 > PC3 …

Score plot loading plot

loading x%
Score x%
Unsupervised Learning
• Clustering
• PCA looks to ﬁnd a low-dimensional representation of the observations that
explain a good fraction of the variance;
• Clustering looks to ﬁnd homogeneous subgroups among the observations.

• K-means clustering
• hierarchical clustering
K-means clustering
• partitioning a data set into K distinct, non-overlapping clusters.
• Specify how many clusters do you want
• The algorithm looks for
local optimum
• Run a few times to see
the different
hierarchical clustering
• tree-based representation of the
observations, called a
dendrogram.
• bottom-up clustering
Algorithms and Packages
• ML Algorithms (many, many, many!)
• Basics: linear-based
• Shrinkage Methods
• Lasso and Ridge regression
• ElasticNet
• Non-linear methods
• Spline
• Support Vector Machines
• Tree based methods
• Decision trees
• Random Forests
• Packages in R
• Individual packages for each algorithm - glmnet
• Meta packages – caret
Unsupervised Learning (con’t)
• Clustering
• Partitional methods
• K-means: partition {x1,…xn} into K clusters where K is
predefined.
• Build a new partition by associating each point with the nearest
centroid
• Compute the centroid (mean point) for each set. Repeat until
converge.
• “kmeans” function in R.
Unsupervised Learning
• Not interest in predicting but discovering patterns
• Find subgroups that you don’t know
• Visualize the results
• Principle component
• Clustering
• Hierarchical clustering– Build a hierarchy of clusters
• Agglomerative: A “bottom up” approach. You start with each element in a separate
cluster, then merge them according to a given property.
• Divisive: A “top down” approach. All elements start in one all-inclusive cluster, then you
split recursively.

BMI 704 - Machine Learning Lab
Document17 pages
BMI 704 - Machine Learning Lab
jakekei5258
No ratings yet
Machine Learning CNN
Document28 pages
Machine Learning CNN
abcd efgh
No ratings yet
W6 Clustering
Document29 pages
W6 Clustering
5599RAJNISH SINGH
No ratings yet
BMI 704 - Machine Learning Lab
Document7 pages
BMI 704 - Machine Learning Lab
jakekei5258
No ratings yet
DW&M Unit 3 Part I
Document101 pages
DW&M Unit 3 Part I
UT DU
No ratings yet
WINSEM2023-24 BEEE410L TH VL2023240502246 2024-03-22 Reference-Material-I
Document95 pages
WINSEM2023-24 BEEE410L TH VL2023240502246 2024-03-22 Reference-Material-I
Rahul ganth
No ratings yet
w6 Clustering
Document29 pages
w6 Clustering
Srisha Prasad Rath
No ratings yet
Viden Io Data Analytics Clustering Kmeans
Document32 pages
Viden Io Data Analytics Clustering Kmeans
Ram Chandu
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document9 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Irum Fatima
No ratings yet
Pattern Classification 06. Feature Selection & Extraction: Abdelmoniem Bayoumi, PHD
Document29 pages
Pattern Classification 06. Feature Selection & Extraction: Abdelmoniem Bayoumi, PHD
Mostafa Mohamed
No ratings yet
Object Recognition
Document43 pages
Object Recognition
A J
No ratings yet
Pattern Recognition
Document52 pages
Pattern Recognition
Waseem Qassab
No ratings yet
Lecture1-3 (2) - Merged
Document408 pages
Lecture1-3 (2) - Merged
Parag Dhanawade
No ratings yet
Modeling Basics: Compartment Models Dimensional Analysis Stochastic Modeling
Document58 pages
Modeling Basics: Compartment Models Dimensional Analysis Stochastic Modeling
Fred
No ratings yet
Lecture 3: Handwriting Recognition and Classification
Document51 pages
Lecture 3: Handwriting Recognition and Classification
kunal13
No ratings yet
Foundations of Machine Learning: Sudeshna Sarkar IIT Kharagpur
Document40 pages
Foundations of Machine Learning: Sudeshna Sarkar IIT Kharagpur
Venkatesh Gaduputi
No ratings yet
Data Analytics Introduction
Document71 pages
Data Analytics Introduction
Leonard Andrew Mesiera
No ratings yet
Foundations of Machine Learning: Module 3: Instance Based Learning and Feature Reduction
Document40 pages
Foundations of Machine Learning: Module 3: Instance Based Learning and Feature Reduction
Nishant Tiwari
No ratings yet
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
Document95 pages
ACFrOgCajrghX8QYes4eQZ0sdYkSYcgCfngE3 G40h28YsPxSNUI5pWUj1kIOR5d1d2nVkHBNqBJQVMMKTJ6lSwm5kuENTMySlduAvwhEcn-N5iutSBNaAaDhkol5Hv3mPmTl0q-ahwmr7GR 2cj
ethan
No ratings yet
Lec1 PerceptronPocket Recap
Document61 pages
Lec1 PerceptronPocket Recap
tejsharma815
No ratings yet
(KtabPDF Com) xrwA7TEBGp
Document32 pages
(KtabPDF Com) xrwA7TEBGp
شجن الزبير
No ratings yet
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Document54 pages
Introduction To Data Science Unsupervised Learning: CS 194 Fall 2015 John Canny
Pedro Jesús García Ramos
No ratings yet
Data Mining CS4168 Lecture 5 Basics of Classification 1
Document25 pages
Data Mining CS4168 Lecture 5 Basics of Classification 1
alina sheikh
No ratings yet
Clustering (Unit 3)
Document71 pages
Clustering (Unit 3)
vedang maheshwari
100% (1)
Classification
Document105 pages
Classification
karvamin
100% (1)
Feature Engineering
Document66 pages
Feature Engineering
arul mamce
No ratings yet
Week 11
Document49 pages
Week 11
SvipDag
No ratings yet
16 dm2 Dimred 2022 23
Document49 pages
16 dm2 Dimred 2022 23
nimra
No ratings yet
CS 464 Introduction To Machine Learning: Feature Selection
Document36 pages
CS 464 Introduction To Machine Learning: Feature Selection
Mathias Bueno
No ratings yet
Supervised Learning: Adane Letta Mamuye (PHD)
Document41 pages
Supervised Learning: Adane Letta Mamuye (PHD)
ABDULHAMID
No ratings yet
Slide 2-Geostatistics-BKEL
Document4 pages
Slide 2-Geostatistics-BKEL
ĐẠT TRẦN
No ratings yet
M8 Klastering
Document83 pages
M8 Klastering
Teofilus Evan
No ratings yet
Bagging+Boosting+Gradient Boosting
Document48 pages
Bagging+Boosting+Gradient Boosting
Parimal Shivendu
100% (1)
w2 - Fundamentals of Learning
Document37 pages
w2 - Fundamentals of Learning
Swastik Sindhani
No ratings yet
Unit5 - Unsupervised Learning
Document48 pages
Unit5 - Unsupervised Learning
Soumya Mishra
No ratings yet
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
Data Mining CH - 5
Document18 pages
Data Mining CH - 5
Hasset Tiss Abay Genji
No ratings yet
Machine Learning Overview
Document54 pages
Machine Learning Overview
RamakrishnaRao Soogoori
No ratings yet
9.54 Class 13: Unsupervised Learning
Document54 pages
9.54 Class 13: Unsupervised Learning
GrantMwakipunda
No ratings yet
Discussion No 4 Pattern Recognition: Group 3
Document20 pages
Discussion No 4 Pattern Recognition: Group 3
rasikalb
No ratings yet
PR01
Document41 pages
PR01
এ.এস. সাকিব
100% (1)
Class 1 X
Document18 pages
Class 1 X
Ronak Panchal
No ratings yet
Principal Component Analysis
Document17 pages
Principal Component Analysis
AsemSaleh
No ratings yet
MLCH9
Document45 pages
MLCH9
sam33rdhakal
No ratings yet
Lect13A-Cluster Analysis-I
Document38 pages
Lect13A-Cluster Analysis-I
6537UTKARSH RAGHUVANSHI
No ratings yet
Unsupervised Machine Learning Techniques
Document24 pages
Unsupervised Machine Learning Techniques
ABDULHAMID
No ratings yet
Learning To Detect Faces A Large-Scale Application of Machine Learning
Document26 pages
Learning To Detect Faces A Large-Scale Application of Machine Learning
vinit
No ratings yet
Clustering K-Means
Document28 pages
Clustering K-Means
Faysal Ahammed
No ratings yet
Kagan Lecture1
Document103 pages
Kagan Lecture1
Narendra Singh
No ratings yet
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Document40 pages
DSS06-DS5 - CLS-Rule Induction, K-NN, Naive Bayesian
Thịnh Thái
No ratings yet
Introduction
Document49 pages
Introduction
Ebrahim Daneshifar
100% (1)
DWDM PPT
Document35 pages
DWDM PPT
Rakesh Kumar
No ratings yet
Churn Prediction Report
Document4 pages
Churn Prediction Report
Ause El
No ratings yet
Seminar 4
Document43 pages
Seminar 4
Ras KO
No ratings yet
L2 A Short Preproc
Document42 pages
L2 A Short Preproc
Shame Bope
No ratings yet
Unsupervised Learning Modi
Document16 pages
Unsupervised Learning Modi
SatishKakarla
No ratings yet
CS464 Ch1 Intro Fall2020
Document83 pages
CS464 Ch1 Intro Fall2020
Mathias Bueno
No ratings yet
Data Analysis and Presentation Skills: An Introduction for the Life and Medical Sciences
From Everand
Data Analysis and Presentation Skills: An Introduction for the Life and Medical Sciences
Jackie Willis
No ratings yet
data science course training in india hyderabad: innomatics research labs
From Everand
data science course training in india hyderabad: innomatics research labs
innomatics research labs
No ratings yet
Data Science Revealed: With Feature Engineering, Data Visualization, Pipeline Development, and Hyperparameter Tuning
From Everand
Data Science Revealed: With Feature Engineering, Data Visualization, Pipeline Development, and Hyperparameter Tuning
Tshepo Chris Nokeri
No ratings yet
Chung - 2019 - Exposome-Wide Association Study of Semen Quality
Document10 pages
Chung - 2019 - Exposome-Wide Association Study of Semen Quality
jakekei5258
No ratings yet
An Introduction To Applied Epidemiology and Biostatistics
Document511 pages
An Introduction To Applied Epidemiology and Biostatistics
Melissa Sindiong
100% (7)
Bmi 701 12 1 2015 PDF
Document132 pages
Bmi 701 12 1 2015 PDF
jakekei5258
No ratings yet
SOT Slides Clean PDF
Document52 pages
SOT Slides Clean PDF
jakekei5258
No ratings yet
Environmental Chemicals, The Human Microbiome, and Health Risk PDF
Document123 pages
Environmental Chemicals, The Human Microbiome, and Health Risk PDF
jakekei5258
No ratings yet
What Can Epidemiological Studies Tell Us About The Impact of Chemical Mixtures PDF
Document4 pages
What Can Epidemiological Studies Tell Us About The Impact of Chemical Mixtures PDF
jakekei5258
No ratings yet
The Cost of Air Pollution PDF
Document122 pages
The Cost of Air Pollution PDF
jakekei5258
No ratings yet
1 - Imputation For GWAS PDF
Document27 pages
1 - Imputation For GWAS PDF
jakekei5258
No ratings yet
Bmi O2
Document7 pages
Bmi O2
jakekei5258
No ratings yet
Lecture 2 Chirag P PDF
Document112 pages
Lecture 2 Chirag P PDF
jakekei5258
No ratings yet
BMI 704 - Machine Learning Lab
Document23 pages
BMI 704 - Machine Learning Lab
jakekei5258
No ratings yet
Chidy Wayne. 1000 Poses in Fashion. 2010 PDF
Document321 pages
Chidy Wayne. 1000 Poses in Fashion. 2010 PDF
Leily Yolimar Salazar
100% (2)
Detecting and Correcting For Bias in Mendelian Randomization Analyses Using Gene-By-Environment Interactions
Document45 pages
Detecting and Correcting For Bias in Mendelian Randomization Analyses Using Gene-By-Environment Interactions
jakekei5258
No ratings yet
Compound Names
Document13 pages
Compound Names
jakekei5258
No ratings yet
SER v2
Document1 page
SER v2
jakekei5258
No ratings yet
LIFE Co-Exposures 092617 EST
Document38 pages
LIFE Co-Exposures 092617 EST
jakekei5258
No ratings yet
Application of Adverse Outcome Pathways To U.S. EPA's Endocrine Disruptor Screening Program
Document11 pages
Application of Adverse Outcome Pathways To U.S. EPA's Endocrine Disruptor Screening Program
jakekei5258
No ratings yet
Maximizing The Mentee-Mentor Relationship - Harvard Catalyst
Document2 pages
Maximizing The Mentee-Mentor Relationship - Harvard Catalyst
jakekei5258
No ratings yet
2011health Indus & Mana Holistic Care & Valuation
Document33 pages
2011health Indus & Mana Holistic Care & Valuation
jakekei5258
No ratings yet
If W'D: of Bi
Document6 pages
If W'D: of Bi
Weining Qu
No ratings yet
Cab1 Business Mathiematics and Statistics en
Document16 pages
Cab1 Business Mathiematics and Statistics en
cwkkarachchi
No ratings yet
One Sample Mean Test
Document1 page
One Sample Mean Test
Kaia Mac
No ratings yet
Statand Prob Q4 M3
Document12 pages
Statand Prob Q4 M3
Jessa Banawan Edulan
0% (1)
Final PSYCH625r5 Wk2 Probability Statistical Analysis
Document5 pages
Final PSYCH625r5 Wk2 Probability Statistical Analysis
Jessica Paone Lara
No ratings yet
4 Time Series
Document31 pages
4 Time Series
J.i. Lopez
No ratings yet
Montgomery-Asberg Depression Rating Scale in Clinical Practice: Psychometric Properties On Serbian Patients
Document7 pages
Montgomery-Asberg Depression Rating Scale in Clinical Practice: Psychometric Properties On Serbian Patients
jhu
No ratings yet
Statistics and Probability 2019-2020
Document5 pages
Statistics and Probability 2019-2020
DINDO L HIOCO
No ratings yet
EmpFinPhDAll PDF
Document360 pages
EmpFinPhDAll PDF
jamilkhann
No ratings yet
5-6 CLRM
Document116 pages
5-6 CLRM
Vishnu Teja Annamraju
No ratings yet
PCA1
Document45 pages
PCA1
Prateek Singh
No ratings yet
MT 330
Document1 page
MT 330
Ali Ahmed
No ratings yet
Tugas Mata Kuliah Statistik Infrensial: Dosen Pengampu: Edy Suryawardana, Se, MM
Document8 pages
Tugas Mata Kuliah Statistik Infrensial: Dosen Pengampu: Edy Suryawardana, Se, MM
April Priscil
No ratings yet
Regression Modeling Strategies - With Applications To Linear Models by Frank E. Harrell
Document598 pages
Regression Modeling Strategies - With Applications To Linear Models by Frank E. Harrell
Apoorva
100% (3)
ChoiceModelR Manual
Document17 pages
ChoiceModelR Manual
Ida Bagus Ketut Wedastra
No ratings yet
A Course in Bayesian Econometrics University of Queensland
Document22 pages
A Course in Bayesian Econometrics University of Queensland
deustoman
No ratings yet
Pertemuan 7z
Document31 pages
Pertemuan 7z
Anto Lae
No ratings yet
Plant Breeding Tools - Software For Plant Breeders PDF
Document40 pages
Plant Breeding Tools - Software For Plant Breeders PDF
sumeetmankar171
67% (3)
Elements of A Test of Hypothesis
Document5 pages
Elements of A Test of Hypothesis
Nadia Alam
No ratings yet
1.a. Descriptive Statistics (Part A)
Document86 pages
1.a. Descriptive Statistics (Part A)
Debleena Mitra
No ratings yet
Marketing Aspect
Document14 pages
Marketing Aspect
meara_julian
100% (2)
Chapter 3 Descriptive Measures
Document12 pages
Chapter 3 Descriptive Measures
Naufal Noori
No ratings yet
Package Fextremes': September 20, 2011
Document37 pages
Package Fextremes': September 20, 2011
Carlos Eduardo Matos
No ratings yet
Notes On Regression For ITM
Document10 pages
Notes On Regression For ITM
Aka G
No ratings yet
Prosiding Seminar Edusainstech ISBN: 978-602-5614-35-4 Fmipa Unimus 2020
Document9 pages
Prosiding Seminar Edusainstech ISBN: 978-602-5614-35-4 Fmipa Unimus 2020
DHEA AMELIA
No ratings yet
Sem 3 Mock 2022 ST Thomas-Q Maths T
Document3 pages
Sem 3 Mock 2022 ST Thomas-Q Maths T
Keertana Subramaniam
No ratings yet
Measures of Central Tendency
Document3 pages
Measures of Central Tendency
statiks
No ratings yet
Time Series Analysis of Inflation
Document26 pages
Time Series Analysis of Inflation
Nuur Ahmed
No ratings yet
Measures of Central Tendency
Document3 pages
Measures of Central Tendency
Reymart Saladas
100% (1)
Descriptive Analytics
Document10 pages
Descriptive Analytics
Arun Kanade
No ratings yet