You are on page 1of 9

PERBANDINGAN MRR ( MEAN RECIPROCAL RANK ) DENGAN METODE NSDF

(NORMALIZED SQUARED DIFFERENCE FUNCTION) PADA SIMULASI


QUERY BY SINGING/HUMMING (QbSH)
UNTUK MUSIK DANGDUT

KHULKIYAH JABBAR D411 08 277


JULITA FARDHANI D411 08 869

Jurusan ElektroFakultas Teknik


Universitas Hasanuddin

ABSTRAK
Query by Singing/Humming (QbSH) adalah sistem pencarian lagu berdasarkan pada
senandung sebagai dasar pencariannya. Tugas akhir ini akan membahas mengenai perancangan
sistem QbSH menggunakan metode Pitch Tracking Normalized Squared Difference Function
dan Linear Scaling (LS) sebagai metode pencocokan melodi.
Sistem dibuat dengan menggunakan database lagu monophonic MIDI bergenre dangdut.
Sample query yang diuji-cobakan dari 3 orang laki-laki dan 3 orang perempuan. Masing-masing
orang menyenandungkan 10 lagu (query) yang ada dalam database. Optimasi hasil dilakukan
dengan menggunakan variasi resolution dan representasi pitch dalam 3, 5, dan 7 level contour.
Berdasarkan simulasi terhadap variasi resolusi dan representasi level contour diperoleh
hasil MRR rata-rata tertinggi pada resolusi 16 dengan 3 level contour yaitu 0.2509. Nilai MRR
terbaik adalah mendekati atau sama dengan 1.

Kata kunci : QbSH, Melodi, Dangdut, NSDF, Linear Scaling, MRR.


PENDAHULUAN suatu system Query by Singing/Humming,
Saat ini, perkembangan teknologi sudah yang berjudul “Perbandingan Mean
merambah pada sistem pencarian informasi Reciprocal Rank (MRR) dengan Metode
mengenai musik digital semisal aplikasi Normalized Squared Difference Function
pencarian lagu. Karena musik digital saat ini (NSDF) pada Simulasi Query by
sudah sangat popular dan mudah didapatkan. Singing/Humming untuk Musik
Sehingga untuk menemukan lagu yang Dangdut”.
diinginkan dari koleksi musik digital
diperlukan waktu yang cukup lama. Untuk PERUMUSAN MASALAH
itu diperlukan suatu search engine yang Masalah pokok yang akan dibahas pada tugas
dapat mempercepat proses pencarian. akhir ini yaitu:
Mengingat ada suatu kondisi dimana 1. Pencocokan melodi untuk musik dangdut
pengguna mencari sebuah lagu dengan cara dalam sistem Query by Singing/Humming
memasukkan judul lagu atau nama penyanyi (QbSH) dengan Pitch Tracking Average
Magnitude Difference Function (AMDF) dan
dari suatu lagu, tetapi akan timbul kesulitan Autocorrelation Function (ACF) dengan
jika pengguna tidak mengetahui judul proses matching menggunakan metode
ataupun penyanyinya tapi pengguna hanya Linear Scaling (LS).
tahu menyanyikan sebagian lirik dari lagu 2. Nilai MRR (Mean Reciprocal Rank) yang
tersebut. Maka dari itu muncullah istilah dihasilkan pada uji sistem QbSH yang
MIR (Music Information Retrieval) yang menggunakan metode AMDF dan ACF
berkaitan dengan representasi, dengan Linear Scaling sebagai matching
penyimpanan, pengorganisasian dan engine dan resolusi sebagai parameter yang
perolehan informasi dari musik itu sendiri. divariasikan .
Sehingga pengguna bisa menemukan lagu 3. Pengaruh jenis kelamin terhadap nilai MRR
yang diinginkan dengan menyanyikan yang dihasilkan.
sebagian teks atau lirik dari lagu.
Sistem pencarian musik yang TUJUAN PENULISAN
dibahas dalam tugas akhir ini adalah sistem Tujuan dari tugas akhir ini adalah sebagai
Query by Singing/Humming (QbSH). berikut:
Dengan sistem QbSH ini, lagu dapat dicari 1. Merancang sistem QbSH untuk musik
hanya dengan menyenandungkan melodi dangdut dengan menggunakan Pitch
dari lagu tersebut. Dengan mengekstraksi Tracking Normalized Squared Difference
fitur melodi berupa pitch, countur, timbre, Function (NSDF) dengan proses
onset ataupun rhythm dari query dan lagu matching engine menggunakan metode
pada database, maka dapat dicocokkan Linear Scaling (LS).
dengan menggunakan matching engine. 2. Membandingkan nilai Mean Reciprocal
Musik dangdut merupakan salah satu Rank (MRR) berdasarkan metode Pitch
warisan dari budaya bangsa Indonesia. Tracking Normalized Squared Difference
Namun sayangnya aliran musik ini mulai Function (NSDF) dengan metode
ditinggalkan oleh masyarakat Indonesia. Hal Average Magnitude Difference Function
itu dikarenakan masyarakat menganggap (AMDF) dan Auto Correlation Function
dangdut adalah jenis musik yang (ACF).
“kampungan”. Dengan adanya tugas akhir 3. Menganalisa pengaruh representasi
ini diharapkan dapat mendukung pelestarian melodi dengan tingkatan level contour
budaya bangsa. Berdasarkan uraian di atas yang digunakan terhadap nilai MRR.
maka tugas akhir ini disusun untuk membuat
BATASAN MASALAH Pada Gambar 1, query dapat berupa
Batasan masalah dalam tugas akhir ini melodi, genre lagu, lirik, tempo, irama dan
adalah sebagai berikut : sebagainya. Lagu-lagu dalam koleksi lagu
1. Database yang digunakan adalah 29 dapat disimpan dalam berbagai macam
MIDI dangdut yang diubah menjadi format file audio, misalnya wav, mp3,
bentuk monoponik. MIDI, realaudio dan sebagainya. MIR
2. Query dari pengguna dilakukan bertujuan untuk memberikan kemudahan
selama 10 detik disimpan dalam dalam mengakses dan menikmati musik.
format wav dengan frekuensi sampling
8000 Hz. PENGERTIAN UMUM QUERY BY
3. Metode pengambilan feature dengan SINGING/HUMMING (QbSH)
menggunakan metode NSDF untuk Query by Singing/Humming (QbSH)
pitch tracking dan note segmentation merupakan salah satu cabang dari Music
by pitch pada note segmentation. Information Retrieval (MIR). QbSH adalah
4. Untuk matching engine menggunakan suatu metode pencarian lagu dengan
metode Linear Scaling. menggunakan senandung. Pencarian
5. Perancangan simulasi ini berdasarkan senandung ini dibutuhkan
menggunakan software Matlab 7.7 karena terkadang pencari lagu tidak
R2008b. mengetahui atau lupa dengan judul lagu atau
nama penyanyinya, melainkan hanya
Query by Singing / Humming (QbSH) mengetahui potongan lagu dari lagu saja.
MUSIC INFORMATION RETRIEVAL (MIR) Potongan lagu tersebut dapat berupa suara
Tujuan Music Information Retrieval vocal senandung. Dengan adanya QbSH ini
(MIR) adalah untuk mencari lagu yang maka akan dimungkinkan suatu pencarian
relevan dengan sebuah query tertentu. Music suatu lagu dari suatu database dengan
Information Retrieval (MIR) adalah bersenandung sebagai query.
pengambilan informasi dari konten suatu Dalam sistem QbSH pada intinya
musik, informasinya dapat berupa penyanyi, adalah pencocokan antara melodi yang
judul, genre dan lain-lain [5]. Maksud dari disenandungkan oleh pencari lagu dengan
pengambilan informasi berdasarkan konten melodi dari database, kemudian sistem akan
dalam informasi yang diambil benar-benar memberikan ranking terhadap lagu yang
berasal dari isi music tersebut, bukan berasal paling mirip melodinya dengan lagu yang
dari teks-teks sisipan (judul, nama penyanyi dimaksud ada dalam peringkat pertama.
dan genre yang biasanya disisipkan pada Tujuan dari diberikan ranking bukannya
MP3). hanya satu kandidat, akan tetapi untuk
Gambaran umum sebuah sistem MIR mengantisipasi bila ada beberapa versi lagu
dapat dilihat pada gambar di bawah ini : atau ada lagu yang memiliki kemiripan
melodi
Query Pencarian Daftar lagu
yang PRINSIP DASAR QUERY BY SINGING /
HUMMING (QbSH)
Prinsip dasar dari sistem Query by Singing /
Koleksi Lagu Humming (QbSH) adalah pencocokan
antara melodi yang disenandungkan oleh
Gambar-1. Gambaran umum sistem Music user dengan melodi dari database,
Information Retrieval [6]
kemudian sistem akan me-ranking /
mengurutkan lagu pada database
berdasarkan melodi yang paling mirip. dari WAV tersebut. Representasi
Ekspektasi dalam simulasi QbSH ini tentu symbol dari query ini yang kemudian
saja agar lagu yang dicari berada pada akan digunakan sebagai query dalam
peringkat pertama. Ada beberapa tahapan pencarian pada database.
proses dalam sistem QbSH, dapat dilihat c. Membandingkan Query dengan Melodi
pada gambar berikut. yang terdapat pada database (Matcing
Diagram blok dari proses Query by Engine)
Singing / Humming Proses ini merupakan proses pencarian
melodi dari database yang sesuai
dengan query yang diinginkan. Proses
ini merupakan proses yang akan
membutuhkan waktu yang cukup lama.
Perbandingan biasanya dilakukan
dengan membandingkan setiap
representasi symbol dari query dengan
setiap entri pada database.
d. Menampilkan Hasil (MRR)
Hasil yang diberikan tidak harus
diberikan dalam satu hasil yang terbaik,
melainkan dalam daftar yang berisikan
sepuluh / dua puluh hasil yang terbaik.
MRR merupakan statistik untuk
Gambar-2. Diagram blok dari QbSH mengevaluasi setiap proses yang
menghasilkan daftar tanggapan untuk
Proses Query by Singing / Humming sebuah query dari probabilitas
memiliki beberapa langkah [8], diantaranya: kebenarannya, yang dirumuskan dalam
a. Membuat Database (database) persamaan (2.2) sebagai berikut [9]:
Database ini dapat dibuat berdasarkan
format audio lagu tertentu. Format lagu
yang akan dibuat sebagai database
biasanya berupa MIDI. Selanjutnya dari Dimana, ri adalah peringkat dari lagu
suatu format suatu lagu tersebut akan yang tepat untuk query ke-I untuk
diambil beberapa jenis feature yang jumlah query yang dilakukan sebesar n.
mencirikan suatu melodi dari lagu Nilai MRR terletak antara 0-1.
tersebut. Kemudian feature yang Semakin medekati nilai 1 maka
diambil tersebut akan menjadi kecocokan antara query dan database
representasi symbol yang disimpan memiliki kemiripan yang hampir sama
dalam database. atau apabila nilai MRR = 1 maka query
b. Memproses Senandung sebagai Query dan databasenya sama.
(Query Feature Extraction)
Format audio dari query yang sering LINEAR SCALING
digunakan adalah WAV (Waveform Linear Scaling (LS) adalah suatu
Audio Format). Selanjutnya dari WAV metode berbasis frame yang paling mudah
tersebut akan diambil juga beberapa dalam proses pencocokan melodi [10].
jenis feature yang sesuai dengan Linear Scaling merupakan metode yang
database yang telah dibuat, sehingga sederhana dan cukup efektif karena hanya
akan didapatkan representasi symbol mengkompres atau meregangkan pitch
vector query untuk mencapai pitch vector
yang sesuai dengan file database. Meskipun
metode ini terbilang sederhana dibandingkan
dengan metode matching yang lain, dalam
prakteknya pitch dari query berbeda dengan
pitch dari database, hal ini sangat
berpengaruh terhadap proses pencocokan

PERANCANGAN SIMULASI QbSH


Perancangan simulasi sistem Query by
Singing/Humming (QbSH) ini menggunakan
piranti perangkat lunak Matlab 7.7 R2008b.
Terdapat tiga proses utama dalam simulasi
sistem QbSH ini yaitu pengolahan database,
pengolahan query dan pencocokan melodi.
Diagram alir simulasi dalam penelitian ini
dapat dilihat pada Gambar-3. Gambar-4. Tampilan Program Simulasi QbSH

Hasil Simulasi dan Pengolahan Data


Simulasi pada sistem QbSH
merupakan uji coba yang dilakukan untuk
mengenali query yang dinyanyikan atau
disenandungkan oleh pengguna selama 10
detik dan mencocokkannya dengan lagu
yang ada pada database. Database yang
digunakan dalam penelitian ini adalah
sebanyak 29 lagu MIDI dangdut. Pengujian
sistem QbSH ini dilakukan dengan
mengambil sampel query dari 6 orang yang
terdiri dari 3 orang laki-laki dan 3 orang
wanita.Setiap orang menyanyikan atau
menyenandungkan 10 dari 29 lagu yang ada
pada database.
Simulasi dilakukan dengan
memvariasikan resolusi dan level contour
representasi melodi yang digunakan dengan
Gambar-3. Diagram Alir Simulasi QbSH menggunakan metode pitch tracking NSDF
(Normalized Squared Difference Function).
Gambar-5. Grafik Uji Coba 3 Level Contour Gambar-9. Grafik Perbandingan Nilai MRR
berdasarkan Metode Pitch Tracking

KESIMPULAN
Berdasarkan hasil pengujian unjuk kerja
pada sistem QbSH yang dilakukan dengan
database dan query seperti dalam percobaan
ini dapat diambil beberapa kesimpulan,
yaitu:
1. Pada system QbSH yang dirancang
Gambar-6. Grafik Uji Coba 5 Level Contour
dengan menggunakan metode pitch
tracking Normalized Squared
Difference Function (NSDF) dan
metode Linear Scaling (LS), jarak
antara query dan database merupakan
hal utama yang mempengaruhi proses
pencocokan.
2. Dari hasil pengujian untuk metode
G AMDF dihasilkan MRR rata-rata paling
tinggi yaitu 0.235, untuk metode ACF
MRR rata-rata paling tinggi sebesar
Gambar-7. Grafik Uji Coba 7 Level Contour 0.1815 sedangkan untuk metode NSDF
nilai MRR rata-rata tertinggi yaitu
0.2509.
3. Representasi melodi yang digunakan
yaitu contour representation dengan 3
level contour memberikan MRR rata-
rata terbaik dibandingkan dengan 5
level contour dan 7 level contour. Jadi,
pada percobaan ini representasi melodi
3 level contur lebih menggambarkan
karakteristik lagu.
Gambar-8. Grafik Perbandingan MRR
Berdasarkan Kondisi saat
Live Recording
SARAN http://digilib.itb.ac.id/files/disk1/626/j
1. Sebaiknya dalam proses simulasi bptitbpp-gdl-eddofajarn-31292-3-
berikutnya menggunakan metode 2008ts-2.pdf
matching yang lain, misalnya Fuzzy [7] Dickerson, Kyle Britton.(2009)
Logic. Musical query-by-content using
2. Dalam proses simulasi berikutnya, self- organizing maps. Thesis.
sebaiknya menggunakan metode pitch Brigham Young University. diakses
tracking yang lain seperti SIFT. Desember 20, 2010 dari
3. Sebaiknya dalam proses simulasi http://contentdm.lib.byu.edu/ETD/ima
berikutnya pada tahap note ge/etd2995.pdf
segmentation digunakan metode yang [8] Durrieu, Jean-Louis. (2006). Music
lain seperti Zero Crossing Rate (ZCR). information retrieval a query by
humming system, segmentation of
the song and aproximative melody
DAFTAR PUSTAKA matching based on the DTW
[1] Kusuma, Wahyu & Irwan Arifin. algorithm. Diakses November 16,
(2006). Analisis penyamaan pitch 2009 dari
interval sinyal melodi senandung http://www.tsi.enst.fr/~durrieu/publis/
untuk pencarian lagu. Seminar Ilmiah durrieu_a_QbH_system.pdf
Nasional Komputer dan Sistem [9] Danneberg, Roger. B., et al. (2007). A
Inteligen (KOMMIT 2006). diakses comparative evaluation of search
Januari 20, 201 dari techniques for query-by-humming
http://repository.gunadarma.ac.id:800 using the MUSART testbed. Journal of
0/Representasi_Chord_Wahyu_Kusu the American Society for Information
ma_dkk_edit_835.pdf Science and Technology, vol. 58, no.
[2] Klapuri, Anssi. (2006). Signal 2, pp.687–701, diakses Januari 15,
processing method for music 2011 dari
transcription.New York: Springer. http://citeseerx.ist.psu.edu/viewdoc/do
[3] Sijabat, David. (2009). Simulasi wnload?doi=10.1.1.70.4028&rep=rep1
Pengenalan Chord Terisolasi &type=pdf
Berbasiskan Speaker Dependent [10] Jyh-Shing Roger Jang. (2003). Audio
Dengan Menggunakan Hidden Markov signal processing and recognition.
Model. Skripsi, Universitas Indonesia, Online course diakses dari
Depok. http://neural.cs.nthu.edu.tw/jang/cours
[4] Wei Chai. (2001). Melody retrieval on es/isa5571/
the web. Thesis. Massachusetts [11] Jyh-Shing Roger Jang, "Melody
Institute of Technology. diakses Recognition Toolbox", available from
Desember 25, 2010 dari the link at the author’s homepage at
http://alumni.media.mit.edu/~chaiwei/ "http://mirlab.org/jang”
papers/msthesis.pdf [12] Jyh-Shing Roger Jang, "Utility
[5] Muller, Meinard. (2007). Information Toolbox", available from the link at
retrieval for music and motion. the author's homepage at
Berlin: Springer. “http://mirlab.org/jang”
[6] Fajar, Eddo N. (2008). Pencarian [13] Jyh-Shing Roger Jang, "Speech and
Melodi pada File MIDI. Bandung: Audio Processing Toolbox", available
Institut Teknologi Bandung, diakses from the link at the author's homepage
Februari 5, 2011 dari
at "http://mirlab.org/jang" /A_Smarter_Way_to_Find_Pitch.pdf
[14] Philip Mcleod, Geoff Wyvill, “A [15] Schutte, Ken. “MATLAB and MIDI”,
Smarterway to Find Pitch” University available from the link at author’s
of Otago. Diakses Januari 15, 2012 homepage at
dari http://www.kenschutte.com/midi
http://miracle.otago.ac.nz/tartini/papers

You might also like