You are on page 1of 7

5.

Uluslar arası İleri Teknolojiler Sempozyumu (İATS’09), 13-15 Mayıs 2009, Karabük, Türkiye

ÖĞRENCİ SEÇME SINAVINDA (ÖSS) ÖĞRENCİ BAARIMINI ETKİLEYEN


FAKTÖRLERİN VERİ MADENCİLİĞİ YÖNTEMLERİYLE TESPİTİ
DETERMINATION OF THE FACTORS INFLUENCING STUDENT’S
SUCCESS IN STUDENT SELECTION EXAMINATION (OSS) VIA DATA
MINING TECHNIQUES
a, * a b
Ahmet Selman Bozkır , Ebru Sezer ve Bilge GÖK
a
Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü, Ankara, Türkiye, E-posta: {selman,esezer}@cs.hacettepe.edu.tr
b
Hacettepe Üniversitesi Sınıf Öğretmenliği Bölümü, Ankara, Türkiye, E-posta: bilgeb@hacettepe.edu.tr

Özet 1. Giriş

Bilindiği üzere ülkemizde Öğrenci Seçme Sınavı her yıl Ülkemizde her yıl ÖSYM’nin (Öğrenci Seçme ve
Haziran ayında ÖSYM tarafından yapılmaktadır. Bu sınava Yerleştirme Merkezi) düzenlediği Öğrenci Seçme Sınavı’na
her yıl bir buçuk milyonun üzerinde öğrenci girmektedir. bir buçuk milyondan fazla öğrenci katılmaktadır. Ülkemizde
Sınav sonucuna göre, Türkiye’de ve yabancı ülkelerde yer yapılan bu sınavın amacı, öğrencileri bir üst eğitim
alan üniversitelere girecek olan öğrenciler tespit basamağına seçmekle birlikte, öğrencilerin okul
edilmektedir. müfredatında yer alan üst düzey düşünme süreçlerine göre
öğrencilerin değerlendirmesini yapmaktır. Bu kapsamda
Veri madenciliği, büyük miktarda veri içinde yer alan gizli ele alındığında, ÖSS’nin bu sınava giren öğrenciler için
ya da açık örüntülerin yapay zekâ, istatistik ve makine büyük bir öneme sahip olduğu görülebilir. Öğrencilerin
öğrenmesi gibi yöntembilimler yardımıyla ortaya sınavlarda ya da derslerde başarılı olmasının sağlanması
çıkarılması sürecidir. ancak başarıyı etkileyen faktörlerin belirlenmesi ile
mümkündür. Bu nedenle öğrencilerin ÖSS’deki başarısını
Bu çalışmada ÖSYM’nin resmi internet sitesinde 2008 etkileyen faktörlerin belirlenmesi bu sınavdan elde edilecek
yılında uygulanmış olan ÖSS öğrenci anketinden elde başarının artmasında önemli rol oynayacaktır.
edilen veriler üzerinde sınıflandırma ve kümeleme
yöntemleri uygulanmış ve öğrencilerin ÖSS sınavında ÖSYM, 2008 yılı ÖSS sınav döneminde sınava giren
gösterdikleri başarıyı etkiyen faktörler tespit edilmiştir. öğrencilerin katıldığı bir anketi resmi internet sitesi
üzerinden düzenlemiştir. Bu ankette öğrencilerin sosyal
Anahtar kelimeler: Veri Madenciliği, ÖSS, Sınıflandırma, durumları, eğitim hayatları ve ebeveynlerinin eğitim
Kümeleme, Karar Ağaçları durumları gibi birçok alanda yaklaşık 80 adet soru
sorulmuştur.
Abstract
Çalışmada kullanılan temel veri kümesi, ankete katılım
As is known, in our country, Student Selection Exam göstermekle birlikte 2008 yılında sınavına girmiş olan
(ÖSS) is applied by Student Selection and Placement 10.000 öğrenciyi kapsamaktadır. Başlangıçtaki veri
Center (ÖSYM) in every June. Over one and half million kümesine, sınav başarısını etkiyen faktörlerin tespiti için,
students take this exam every year. According to the yine bu öğrencilere ait OBP (orta öğretim başarı puanı),
results of this examination, the students who are possible AOBPSAYISAL, AOBPEA, AOBPSOZEL gibi ağırlıklı orta
to attend both the universities in Turkey and the other öğretim başarı puanları ile birlikte diğer birçok puan türüne
countries are determined. ait veriler eklenerek sonuç veri kümesi elde edilmiştir.

Data mining is the period of revealing the explicit or hidden Bu çalışmanın amacı elde edilen bilgiler doğrultusunda,
patterns in huge amount of data via artificial intelligence, ÖSS’de başarıyı temsil etmekte kullanılan sözel, sayısal,
statistics or machine learning techniques. eşit ağırlık puanları ve bu puan türlerinde Türkiye’deki
başarı sıralarıyla birlikte OBP ve AOBP türlerindeki puanlar
In this study, classification and clustering methods applied gibi bazı sonuçları etkileyen en önemli faktörleri bulmaktır.
to the ÖSS student poll data that is collected in OSYM’s Bununla birlikte Matematik, Fen, Sosyal Bilgiler, Türkçe ve
legal web site in 2008 and the factors that affect success Sanat derslerine gösterilen ilginin, bu derslerde öğrencinin
of students are determined. kendini başarılı görme derecesinin ve bu dersler için
ayrılan ödev zamanının üstte belirtilen sonuçlar üzerindeki
Keywords: Data Mining, OSS, Classification, Clustering, etkileri araştırılmıştır. Araştırma sonucunda oldukça
Decision Trees çarpıcı bağıntılar yakalandığı düşünülmektedir.

Bildiride veri madenciliği kavramı ele alınarak çalışmada


kullanılan veri madenciliği yöntemleri bölüm 2’de
sunulmuş, bölüm 3’te konuyla ilgili benzer çalışmalardan
söz edilmiş ve bölüm 4’te çalışmada yer alan analizlerin
oluşturulma süreci ve elde edilen sonuçları verilmiştir.

© IATS’09, Karabük Üniversitesi, Karabük, Türkiye


Bozkır, A.S., Sezer E. ve Gök B.

2. Veri Madenciliği Bu çalışmada yine Analysis Services 2008 ürünü ile birlikte
gelen Expectation Maximization (EM) algoritması
Veri madenciliği, yararlı bilginin büyük veri depolarından kullanılmıştır.
otomatik olarak keşfedilme sürecidir [1]. Diğer bir deyişle,
veri madenciliği tek başına bir şey ifade etmeyen veriler 3. Önceki Çalışmalar
içindeki gizli örüntüleri ve ilişkileri ortaya çıkarmak için
istatistik, yapay zekâ ve makine öğrenmesi gibi Bir çalışmada veri madenciliği yöntemleri ÖSS verilerine
yöntemlerin ileri veri çözümleme araçlarıyla kullanılmasını uygulanarak Türkiye ve İzmir genelinde çeşitli istatistik
kapsayan süreçler topluluğudur [2]. Veri madenciliği sonuçlar ortaya konmuştur [4]. Diğer bir çalışmada ise
yöntemleri iki grupta toplanmaktadır: ÖSS verilerine karar ağaçları ve birliktelik kuralları
yöntemleri uygulanarak öğrencilerin tercih profilleri ortaya
1. Kestirimsel yöntemler (karar ağaçları, regresyon, konulmaya çalışılmıştır [5]. Yine başka bir çalışmada ÖSS
destek vektör makineleri vs.) sonuçları yıllara, bölgelere ve okul türlerine göre
2. Tanımlayıcı yöntemler (kümeleme, birliktelik incelenmiştir [6].
kuralları vs.)
4.Uygulama
Kestirimsel modellerde amaç mevcut verileri kullanarak
geleceğe yönelik kestirimler yapabilmek iken, tanımlayıcı Çalışmanın özünü oluşturan veri kümesi daha önceki
modellerde amaç yine mevcut veri içindeki gizli ilişkileri, bölümlerde de verildiği üzere ÖSYM’nin internet sitesinde
kümeleri ve veriyi niteleyebilecek olan özellikleri ortaya 2008 ÖSS dönemine ilişkin yayınlanmış olan öğrenci bilgi
çıkarmaktır [2]. anketini temel almaktadır. Bu anket içersinde yer alan
birçok soru içersinden çalışmanın amacına yönelik olarak
Bu araştırmada her iki yöntem grubundan da öğrencilerin Matematik, Türkçe, Fen Bilgisi, Sosyal Bilgiler,
yararlanılmıştır. Öğrenci başarımını temsil eden niteliklerin Yabancı Dil ve Sanat derslerine olan ilgileri ve bu derslere
(Ör: ÖSSSAYISAL2 puanı) tahmininde karar ağaçları ayırdıkları ödev süreleri ile yine bu derslerde kendilerini ne
tekniğinden yararlanılırken, çeşitli öğrenci profillerinin kadar başarılı buldukları gibi sorular seçilmiştir. Buna ek
oluşturulmasında kümeleme yöntemi kullanılmıştır. olarak cinsiyet, yaş, alan belirleme, sınıf mevcudu,
ebeveynlerin eğitim düzeyi, kardeş sayısı, internet ve
Çalışmanın yapıldığı uygulama platformu olarak aşağıda bilgisayar erişimi, gazete alımı, lise döneminde alınan özel
belirtilen bazı özellikleri nedeniyle Microsoft’un bir ürünü ders ve dershane durumu vs. gibi diğer sosyal bilgileri
olan Analysis Services 2008 seçilmiştir. içeren sorular da seçilmiştir.

2.1. Karar Ağaçları Ankette yer alan toplam 80 adet soru öğrencilerin okulda
aldıkları eğitimle ilgili durumları ve sosyal durumlarını
Karar ağaçları, başarım oranının yüksekliği yanında kolay araştırmaya yönelik dereceleme sorularından
anlaşılır bir grafiksel yorumu olması sebebiyle en çok oluşmaktadır. Çalışmanın ilk aşamasında konuyla
tercih edilen kestirimsel yöntemdir. Bir karar ağacı için en yakından ilgisi bulunmayan veya sıklıkla boş cevap içeren
genel veri madenciliği görevi sınıflandırmadır [3]. sorular veri kümesinden çıkarılmıştır. Çalışmanın amacı
Bir karar ağacı algoritmasının prensipte görevi veriyi ÖSS başarımını etkileyen faktörleri tespit etmek
özyinelemeli olarak alt veri gruplarına dallanma yaparak olduğundan, bu noktada öğrencinin başarı ölçütü olarak
bölmektir. Bu ayrım aşamasında oluşan her yeni dal bir kabul edilen sınavda yerleşme durumu, türlerine göre ÖSS
kuralı ifade etmektedir. puanları ve başarı sırası, OBP, AOBPSAYISAL,
AOBPSÖZEL ile AOBPEA puanları veri kümesine
Karar ağacı algoritmaları içinde ID3, C4.5, C5.0, M5P, J48, eklenmiştir. Bu eklemelerden sonra sonuç veri kümesi 77
Microsoft Decision Trees algoritmaları sıklıkla kullanılan niteliğe sahip olmuştur.
algoritmalardır. İyi bir karar ağacı algoritması hem ayrık
hem de sürekli veriler üzerinde çalışabilmelidir. Sürekli veri Veriler ÖSYM’den geldikleri ilk biçim olan SPSS kütük
üzerinde oluşturulan modellere regresyon ağacı adı biçiminden, Analysis Services için tanınabilir bir kütük
verilmektedir. biçimi olan Microsoft Access kütük biçimine
dönüştürülmüştür. Ayrık veri içeren nitelikler içinde sayısal
Niteliklerin birbirleri üzerindeki etkilerini sergileyen olarak kodlanmış veriler gerçek metinsel karşılıklarına
bağımlılık ağları grafiğini üretebilme özelliğinden dolayı dönüştürülerek anlaşılabilirlik arttırılmıştır.
Microsoft Decision Trees algoritması tercih edilmiştir.
Veri madenciliği yöntemlerinin uygulanacağı verinin temiz
2.2. Kümeleme ve tutarlı olması (boş verinin olmaması, uygunsuz değerleri
içermemesi) uygulamanın başarısı açısından çok
Kümeleme en basit deyişle, veri içindeki doğal grupların önemlidir. Bu nedenle birçok soruyu boş bıraktığı tespit
keşfedilmesi işlemidir. İnsanoğlu için beş ya da altı niteliğe edilen 48 katılımcı, 10.000 katılımcının bulunduğu veri
sahip bir nesneler topluluğunu, niteliklerdeki benzerliklere kümesinden çıkarılmıştır. Kalan 9952 katılımcıdan 1000
bakarak gruplamak mümkünken bu sayının çok daha fazla adedi test amaçlı, kalan 8952 adedi ise karar ağacı ve
olması durumunda bu işlem olanaksız hale gelmektedir. kümeleme modelinde eğitim amaçlı olarak ayrılmıştır.
Bu noktada tanımlayıcı bir veri madenciliği yöntemi olan
kümeleme devreye girmekte ve veriyi çeşitli tekniklerle
önceden sayısı bilinmeyen kümelere bölmektedir.
Bozkır, A.S., Sezer E. ve Gök B.

4.1. Karar Ağacı Modeli Çalışması Çizelge 1 Bağımlılık ağı bulguları.

Oluşturulan eğitim kümesi üzerinde Microsoft Decision Nitelik Etkileyen Faktörler


Trees algoritması varsayılan parametrelerle kullanılarak iki OBP 1.AOBPEA (%98)
farklı model oluşturulmuştur. 2.AOBPSAYISAL (%97)
3.AOBPSÖZEL (%95)
Birinci modelde, öğrencilerin çeşitli alanlardaki başarı 4.Yaşı (%94)
sıralamasında doğal bir etkiye sahip olması sebebiyle 5.Okul Türü (82%)
sayısal, sözel ve eşit ağırlık türündeki puanlar hem girdi 6.İlgi – Sanat Dersleri (%70)
hem de kestirim amaçlı (prediction) kullanılmıştır. İkinci 7.Mat. Ödv. Zaman (%61)
modelde sayısal, sözel ve eşit ağırlık türündeki puanlar 8.Fen B. Lab. Kul. (%58)
sadece tahmin amaçlı (prediction only) kullanılarak diğer 9.Lisede Sınıf Mevcut (%48)
nitelikler üzerinde etki oluşturmayacak bir model 10.Anne Egt. Düz. (%48)
oluşturulmuştur. Böyle bir yöntem izlenmesinin başlıca 11.Eve Gazete Alımı (%46)
nedeni öncül-soncul ilişkisi göz önüne alındığında, sayısal, 12.Baş. Bul. Yab. Dil (%45)
sözel ve eşit ağırlık puanlarının, OBP veya benzer biçimde 13.Baba Egt. Düz. (%44)
diğer herhangi bir sosyal nitelik üzerinde mantıksal bir 14.Baş. Bul.Türkçe (%43)
faktör olamayacağı gerçeğidir. Sınav sonuçlandırma 15.Lisede Dershane (%42)
sürecinde, öğrencilerin eğitim hayatları boyunca elde
ettikleri OBP, AOBPSAYISAL, AOBPSÖZEL, AOBPEA AOBPSAYISAL 1.Yaşı (%95)
gibi puanlar ve net doğru sayıları girdiyi oluşturmakta ve 2.AOBPEA (%95)
nihai puanlar bu girdiler doğrultusunda hesaplanmaktadır. 3.OBP (%94)
4.AOBPSÖZEL (%94)
Veri madenciliği açısından, nihai ÖSS puanlarının hem 5.Okul Türü (%85)
girdi hem de tahminsel olarak tanımlandığı bir model, 6.Fen B. Lab. Kul. (%74)
öğrencilerin başarı sıralamasını etkileyen faktörleri tespit 7.Eve Gazete Alımı (%45)
etmede başarılı sonuçlar üretebilir ancak diğer nitelikler 8.Tepegöz Kullanımı (%43)
üzerinde anlamsız sonuçları da beraberinde getirir. 9.Lisede Sınıf Mevcut (%41)
Dolayısıyla doğru bir analiz için ikinci bir karar ağacı 10.D.Yön. F.K. İlişki (%40)
modelinin oluşturulması kaçınılmazdır.
AOBPSÖZEL 1.AOBPSAYISAL (%99)
Oluşturulan ikinci karar ağacında sayısal, sözel ve eşit 2.Yaşı (%98)
ağırlık türlerine ait sonuç puanlar sadece kestirim 3.OBP (%98)
(prediction only) olarak tanımlanmış, diğer niteliklerde bir 4.AOBPEA (%98)
değişiklik yapılmamıştır. 5.Okul Türü (%53)

Bağımlılık ağları (Dependency Network), oluşturulan AOBPEA 1.Yaşı (%96)


modelin içeriğinden yola çıkarak nitelikler arasındaki 2.AOBPSÖZEL (%95)
ilişkileri gösterir [3]. Bu çalışmada da aynı tür ilişkileri 3.OBP (%95)
yakalamak için Microsoft Decision Trees algoritması 4.AOBPSAYISAL (%95)
yardımıyla oluşan bağımlılık ağları ile niteliklerin birbirleri 5.Okul Türü (%51)
üzerindeki etkileri tespit edilmiştir. 6.Alan Belirleme (%50)

ÖSSSAY1 1.AOBPSAYISAL (%100)


2.AOBPEA (%99)
3.OBP (%98)
4.AOBPSÖZEL (%96)
5.Yaşı (%95)
6.Baş. Bul. Mat. (%81)
7.Baş. Bul. Fen Bil. (%71)
8.İlgi – Sosyal Bilimler (%60)
9.D.Yön. F.K. İlişki (%60)
10.Alan Belirleme (%56)

ÖSSSAY2 1.AOBPEA (%98)


2.OBP (%98)
3.AOBPSÖZEL (%95)
Rekil 1. Model üzerinde oluşan bağımlılık ağı. 4.AOBPSAYISAL (%94)
5.Yaşı (%94)
Oluşturulmuş iki farklı karar ağacı modeline ait birleştirilmiş 6.Baş. Bul. Mat. (%81)
bulgular Çizelge 1’de listelenmiştir. Çizelgede, çeşitli 7.Okul Türü (%79)
niteliklere göre farklı sayıda faktör sunulmuştur. 8.İlgi – Sosyal Bilimler (%76)
Niteliklerden bazılarını etkileyen faktör sayısı beşi 9.Baş. Bul. Yab. Dil (%75)
geçemezken bazı nitelikler için bu sayı 15’i geçmektedir. 10.İlgi –Sanat Dersleri (%69)

ÖSSSÖZ1 1.AOBPSÖZEL (%91)


Bozkır, A.S., Sezer E. ve Gök B.

2.Yaşı (%91) 4.ÖSSEA2 (%93)


3.OBP (%91) 5.ÖSSEA1 (%92)
4.AOBPSAYISAL (%90)
5.AOBPEA (%90) Başarı Sırası 1.ÖSSSÖZ1 (%88)
6.Okul Türü (%78) (SÖZ1) 2.AOBPEA (%86)
7.Lisede Dershane (%71) 3.ÖSSSAY2 (%86)
8.Baş. Bul. Türkçe (%70) 4.OBP (%84)
9.İlgi – Sosyal Bilimler (%68) 5.ÖSSEA1 (%80)
10.İlgi – Fen Bilimleri (%59)
Başarı Sırası 1.ÖSSSÖZ1 (%98)
ÖSSSÖZ2 1.Yaşı (%97) (SÖZ2) 2.ÖSSEA2 (%97)
2.AOBPSAYISAL (%95) 3.ÖSSSÖZ2 (%91)
3.OBP (%91) 4.ÖSSEA1 (%90)
4.AOBPSÖZEL (%90) 5.ÖSSSAY1 (%89)
5.AOBPEA (%90)
6.Baş. Bul. Fen Bil. (%81) Başarı Sırası 1.ÖSSEA1 (%95)
7.İlgi – Sanat Dersleri (%80) (EA1) 2.ÖSSSÖZ1 (%91)
8.D.Yön. Det.Anl. Çalış. (%80) 3.ÖSSSAY1 (%91)
9.Okul Türü (%78) 4.ÖSSSÖZ2 (%88)
10.Fen B. Ödv. Zmn. (%76) 5.ÖSSSAY2 (%88)

ÖSSEA1 1.AOBPSÖZEL (%100) Başarı Sırası 1.AOBPSÖZEL (%95)


2.OBP (%99) (EA2) 2.ÖSSEA1 (%95)
3.AOBPSAYISAL (%99) 3.ÖSSSAY1 (%95)
4.Yaşı (%96) 4.ÖSSSÖZ1 (%93)
5.AOBPEA (%94) 5.AOBPEA (%93)
6.Lisede Dershane (%81)
7.Okul Türü (%79) Alan Belirleme 1.Okul Türü (%77)
8.Yab. Dil. Lab. Kul. (%65) 2.AOBPEA (%70)
9.Baş. Bul. Fen Bil. (%52) 3.Lisede Sınıf Mevcut (%67)
10.Alan Belirleme (%51) 4.Lisede Dershane (%53)

ÖSSEA2 1.AOBPSÖZEL (%90) İlgi – Fen 1.Baş. Bul. Fen Bil. (%85)
2.OBP (%90) Bilimleri 2.İlgi – Yabancı Dil Ders (%80)
3.AOBPSAYISAL (%90) Dersleri 3.İlgi – Mat. Ders (%75)
4.Yaşı (%89)
5.AOBPEA (%89) Kendini Fen 1.İlgi – Fen Bilimleri (%91)
6.Okul Türü (%83) Bilimleri 2.Baş. Bul. Mat. (%76)
7.İlgi – Yabancı Dil Ders (%75) Derslerinde 3.Baş. Bul. Yab. Dil (%75)
8.Kardeş Sayısı (%71) Başarılı Bulma 4.İlgi – Yabancı Dil Ders (%45)
9.Baş. Bul. Fen Bil. (%70)
10.Türkçe Ödev Zamanı (%68) Fen Bilimleri 1.Mat. Ödv. Zaman (%81)
Derslerine 2.İlgi – Fen Bilimleri (%81)
Yerleşme 1.ÖSSEA1 (%60) Ayrılan Ödev 3.Baş. Bul. Fen Bil. (%80)
Durumu Zamanı 4.Sosyal Bil. Ödv. Zmn (%58)
5.Türkçe Ödev Zamanı (%56)
Yerleştiği 1.ÖSSSAY1 (%89)
Tercih Sırası 2.ÖSSSÖZ2 (%89) İlgi – 1.Baş. Bul. Mat. (%92)
3.ÖSSEA2 (%88) Matematik 2.İlgi – Fen Bilimleri (%78)
4.ÖSSSÖZ1 (%87) Dersleri
5.OBP (%86)
6.AOBPSAYISAL (%84) Kendini 1.İlgi – Mat. Ders (%92)
7.ÖSSSAY2 (%84) Matematik 2.Baş. Bul. Fen Bil. (%78)
8.ÖSSEA1 (%80) Derslerinde 3.Baş. Bul. Türkçe Dersi (%59)
9.AOBPEA (%79) Başarılı Bulma 4.Baş. Bul. Yab. Dil (%40)
10.AOBPSÖZ (%79)
Matematik 1.Türkçe Ödev Zamanı (%89)
Başarı Sırası 1.AOBPEA (%96) Derslerine 2.Fen B. Ödv. Zmn. (%76)
(SAY1) 2.ÖSSSAY1 (%94) Ayrılan Ödev 3.Baş. Bul. Mat. (%78)
3.ÖSSSÖZ1 (%94) Zamanı 4.Sosyal Bil. Ödv. Zmn (%57)
4.ÖSSEA1 (%90)
5.AOBPSAYISAL (%87) İlgi – Türkçe 1.Baş. Bul. Türkçe (%86)
Dersi 2.İlgi – Sosyal Bilimler (%78)
Başarı Sırası 1.ÖSSSAY1 (%95) 3.İlgi – Mat. Ders (%72)
(SAY2) 2.ÖSSSAY2 (%94) 4.Baş. Bul. Sosyal Bil. (%78)
3.ÖSSSÖZ1 (%94)
Bozkır, A.S., Sezer E. ve Gök B.

Kendini Türkçe 1.İlgi – Türkçe Dersi (%84) Baş. Bul. Fen Bil. Öğrencinin fen bilimleri derslerinde
Dersinde 2.Baş. Bul. Sosyal Bil. (%77) kendini ne derece başarılı bulduğu
Başarılı Bulma 3.AOBPEA (%72) Baş. Bul. Türkçe Öğrencinin Türkçe derslerinde kendini
4.İlgi – Sosyal Bilimler (%68) ne derece başarılı bulduğu
5.Baş. Bul. Yab. Dil (%58) Baş. Bul. Yab. Dil Öğrencinin yabancı dil derslerinde
kendini ne derece başarılı bulduğu
Türkçe Dersine 1.Mat. Ödv. Zaman (%84) Baş. Bul. Sosyal Öğrencinin sosyal bilimler derslerinde
Ayrılan Ödev 2.Sosyal Bil. Ödv. Zmn (%80) Bil. kendini ne derece başarılı bulduğu
Zamanı 3.D.Yön. Det.Anl. Çalış. (%45) Baş. Bul. Sanat Öğrencinin sanat ağırlık derslerde
Ders kendini ne derece başarılı bulduğu
İlgi – Sosyal 1.Baş. Bul. Sosyal Bil. (%87) D.Yön. Det.Anl. Ders Çalışma Yöntem: Tüm detayları
Bilimler 2.Baş. Bul. Mat. (%78) Çalış anlamaya çalışırım
Dersleri 3.İlgi – Mat. Ders (%75) D.Yön. F.K. İlişki Ders Çalışma Yöntem: Farklı
4.İlgi – Türkçe Dersi (%70) konularla ilişkilendiririm
5.Baş. Bul. Türkçe (%45) Fen B. Lab. Kul. Fen bilimleri derslerinde laboratuar
kullanımı
Kendini Sosyal 1.İlgi – Sosyal Bilimler (%86) Anne Egt. Düz. Anne Eğitim Düzeyi
Bilimler 2.Baş. Bul. Türkçe (%76) Baba Egt. Düz. Baba Eğitim Düzeyi
Derslerinde 3.Baş. Bul. Yab. Dil (%70)
Başarılı Bulma 4.İlgi – Türkçe Dersi (%61) Çizelge 1 incelendiğinde tespit edilebilen bulgulardan öne
çıkanlar aşağıda listelenmiştir:
Sosyal Bilimler 1.Türkçe Ödev Zamanı (%85)
Derslerine 2.İlgi – Sosyal Bilimler (%70) • Öğrencilerin herhangi bir derse gösterdikleri ilgi ile
Ayrılan Ödev 3.Fen B. Ödv. Zmn. (%61) o derste kendilerini başarılı bulmaları arasında
Zamanı 4.Mat. Ödv. Zaman (%57) karşılıklı korelasyon bulunmaktadır. Bu kural tüm
5.İlgi – Türkçe Dersi (%46) dersler için tespit edilmiştir.
• Bütün ders türleri için öğrencilerin kendilerini
İlgi – Yabancı 1.Baş. Bul. Yab. Dil (%86) başarılı görmelerini etkileyen faktörler ele
Dil Dersleri 2.İlgi – Sanat Dersleri (%77) alındığında yabancı dil derslerinde kendilerini
3.İlgi – Fen Bilimleri (%61) başarılı bulmaları önemli yer tutmaktadır.
• OBP’yi etkileyen faktörler içerisinde sanat
Kendini 1.İlgi – Yabancı Dil Ders (%87) derslerine gösterilen ilginin %70 ve de eve gazete
Yabancı Dil 2.Baş. Bul. Sanat Ders (%75) alımının %46 olması dikkat çekicidir.
Derslerinde 3.Baş. Bul. Türkçe (%65) • OBP, AOBPSAYISAL, AOBPSÖZEL, AOBPEA ve
Başarılı Bulma 4.Baş. Bul. Fen Bil. (%57) tüm ÖSS puan türlerine etkiyen faktörler içersinde
5.Baş. Bul. Mat. (%50) öğrencinin yaşı ilk beşte yer almıştır.
• ÖSSSÖZ1 ve ÖSSSÖZ2 puan türlerine etkiyen
İlgi – Sanat 1.Baş. Bul. Sanat Ders (%87) faktörler içersinde Fen Bilimleri derslerine
Dersleri 2.İlgi – Yabancı Dil Ders (%79) gösterilen ilginin (%59) ve ayrılan ödev zamanının
(%76) önemli bir orana sahip olması dikkat
Kendini Sanat 1.İlgi – Sanat Dersleri (%87) çekicidir.
Derslerinde 2.Baş. Bul. Yab. Dil (%76) • Sosyal Bilimlere gösterilen ilgiye etkiyen faktörler
Başarılı Bulma 3.Baş. Bul. Mat. (%50) içersinde öğrencinin kendini Matematik
derslerinde başarılı bulması %78 ile ikinci sırada,
Matematik derslerine gösterilen ilgi %75 ile
Verilmiş olan çizelgedeki kısaltmaların tam karşılıkları üçüncü sırada yer almıştır.
aşağıdaki Çizelge 2’de sunulmuştur: • ÖSSSAYISAL1, ÖSSÖZEL1 ve ÖSSEA1 puanları
üzerine etkiyen faktörler ile sırasıyla
Çizelge 2 Bağımlık ağında kullanılan kısaltmalar. ÖSSSAYISAL2, ÖSSSÖZE2 ve ÖSSEA2
puanları üzerine etkiyen faktörler arasında büyük
Kısaltma Kısaltmanın Gerçek Karşılığı benzerlikler vardır.
OBP Orta Öğretim Başarı Puanı • ‘Lisede Dershane’ niteliğinin sadece ÖSSEA1
AOBPSAYISAL Ağırlıklı Orta Öğretim Başarı Puanı (%81) ve ÖSSSÖZ1 (%71) puanları üzerinde
(SAYISAL) etkili olması dikkat çekicidir.
AOBPSÖZEL Ağırlıklı Orta Öğretim Başarı Puanı
(SÖZEL) Çizelge 1’de belirtilmiş bulgular üzerinden daha birçok
AOBPEA Ağırlıklı Orta Öğretim Başarı Puanı yorum çıkarmak mümkündür. Ancak çalışmanın sınırlı
(ERİT AĞIRLIK) sayıda sayfaya sahip olması nedeniyle ilginç olduğu
Mat. Ödv. Zaman Matematik dersleri için ayrılan ödev düşünülen daha birçok yorum okuyucuya bırakılmıştır.
zamanı
Fen B. Ödv. Zmn. Fen bilimleri derslerine ayrılan ödev 4.2. Kümeleme Modeli Çalışması
zaman
Sosyal Bil. Ödv. Sosyal bilimleri derslerine ayrılan
Kümeleme çalışmasının amacı çeşitli öğrenci profillerinin
Zmn ödev zamanı
ortaya konulması ve oluşan kümeler içerisinde en başarılı
Baş. Bul. Mat. Öğrencinin matematik derslerinde
ve başarısız kümelerin genel olarak özelliklerinin
kendini ne derece başarılı bulduğu
Bozkır, A.S., Sezer E. ve Gök B.

karşılaştırılabilineceği bir ortamın yaratılmasıdır. AOBPSözel 95,32 +/- 85,34 +/- 76,56 +/-
2,64 7,16 5,94

AOBPEA 95,36 +/- 84,39 +/- 74,45 +/-


2,61 7,82 6,35

Yerleşme Evet: %87 Evet: %65 Evet:%50


Hayır: %13 Hayır: %35 Hayır:%50

Yaş 18,55 +/- 19,61 +/- 21,31 +/-


0,92 1,95 3,93

Cinsiyet Erkek: %47 Erkek: %70 Erkek: %67


Kız: %53 Kız: %30 Kız: % 33

Okul Öncesi Hiç: %40 Hiç: %66 Hiç: %77


Rekil 2. Kümeleme modelinde keşfedilen kümeler. Eğitim 1 yıl: %33 1 yıl: %24 1 yıl: %17
2 yıl: %15 2 yıl: %6 2 yıl: %3
Kümeleme tekniği ile ankete katılan öğrenciler çeşitli 3 yıl: %6 3 yıl: %2 3 yıl: %1
gruplara bölünmüştür. Daha esnek ve başarılı kümeleme >4 yıl: %4 >4 yıl: %1 >4 yıl: %0
yapması nedeniyle Expectation Maximization
algoritmasının kullanıldığı kümeleme modelinde belli bir ÖSSSAY1 249,04 +/- 219,44 +/- 155,11 +/-
küme sayısı verilmemiş olup algoritmanın otomatik 26,11 28,28 14,94
kümeleme yapması sağlanmıştır.
ÖSSSAY2 238,19 +/- 200,38 +/- 47,43 +/-
Analiz sonucunda 7 adet küme tespit edilmiştir. Oluşan 29,32 29,04 70,50
kümeler içerisinde gerek bir yüksek öğretim programına
yerleşme oranı gerekse de diğer birçok nitelik temel ÖSSSÖZ1 257,37+/- 211,11 +/- 196,32 +/-
alındığında en başarılı küme, 800 katılımcıya sahip “Küme 14,50 28,31 25,29
6” olarak belirlenmiştir. Yine aynı özellikler dikkate
alındığında, 2072 katılımcıya sahip “Küme 2” en başarısız ÖSSSÖZ2 94,61 +/- 0 177,42 +/-
küme seçilmiştir. Bunlara ek olarak “Küme 3”, sahip olduğu 114,48 27,59
1935 katılımcısıyla orta sırada yer alan diğer önemli bir
küme olarak ortaya çıkmaktadır. ÖSSEA1 261,33 +/- 221,61 +/- 181,70 +/-
14,81 26,65 20,42

ÖSSEA2 236,74 +/- 184,75 +/- 160,62 +/-


16,92 42,35 33,45

Okul Evet: %2 Evet: %0 Evet: %0


Birincisi Hayır: %98 Hayır: %100 Hayır: %100

Bilgisayar Var: %93 Var: %84 Var: %81


Erişimi Yok: %7 Yok: %15 Yok: %17

İnternet Var: %87 Var: %73 Var: %74


Erişimi Yok: %13 Yok: %26 Yok: %25

Çalışma Var: %96 Var: %86 Var: %74


Odası Yok: %4 Yok: %14 Yok: %24

Rekil 3. Küme profil grafiği. İlköğretimde Hiç: %15 Hiç: %44 Hiç: %74
Dershane 1 yıl: %33 1 yıl: %28 1 yıl: %15
Yukarıda belirtilen üç kümenin çeşitli özellikleri ve belirgin 2 yıl: %31 2 yıl: %16 2 yıl: %6
farkları Çizelge 3’de listelenmiştir. Sayısal niteliklerde 3 yıl: %9 3 yıl: %6 3 yıl: %2
temel olarak ortalama ve standart sapmalar belirtilmiştir. >4 yıl: %11 >4 yıl: %5 >4 yıl: %2

Çizelge 3 Kümeleme sonuçları. İlköğretimde Hiç: %74 Hiç: %82 Hiç: %84
Özel Ders 1 yıl: %19 1 yıl: %10 1 yıl: %9
Nitelik Küme 6 Küme 3 Küme 2 2 yıl: %3 2 yıl: %3 2 yıl: %3
OBP 85,86 +/- 73,91 +/- 65,99 +/- 3 yıl: %2 3 yıl: %1 3 yıl: %1
8,85 11,20 8,14 >4 yıl: %1 >4 yıl: %2 >4 yıl: %0

AOBPSayısal 94,44 +/- 82,03 +/- 71,46 +/- Lisede Hiç: %2 Hiç: %17 Hiç: %52
3,22 8,96 6,81 Dershane 1 yıl: %11 1 yıl: %24 1 yıl: %27
2 yıl: %38 2 yıl: %34 2 yıl: %13
Bozkır, A.S., Sezer E. ve Gök B.

3 yıl: %40 3 yıl: %19 3 yıl: %5 5. Sonuç


>4 yıl: %7 >4 yıl: %6 >4 yıl: %1 Bu çalışmada ÖSYM tarafından 2008 ÖSS adayları için
resmi internet sitesi üzerinden yapılan anket verileri
Lisede Özel Hiç: %65 Hiç: %76 Hiç: %83 üzerinde veri madenciliği yöntemleri kullanılarak,
Ders 1 yıl: %21 1 yıl: %13 1 yıl: %10 öğrencilerin başarılarını etkileyen faktörler araştırılmıştır.
2 yıl: %10 2 yıl: %6 2 yıl: %4
3 yıl: %4 3 yıl: %3 3 yıl: %1 Araştırma kapsamında, OBP puanı tüm öğrencilerin
>4 yıl: %0 >4 yıl: %1 >4 yıl: %0 ÖSS’de ortak başarı ölçütü olarak ele alınırsa bu puan
türüne etkiyen en önemli beş faktörün yaş, okul türü, sanat
Lisede Sınıf <20: %13 <20: %10 <20: %5 derslerine ilgi, matematik dersi için harcanan ödev zamanı
Mevcut 20-30: %75 20-30: %46 20-30: %29 ve fen bilgisi laboratuar kullanım oranı olduğu görülmüştür.
31-40: %9 31-40: %30 31-40: %37 Diğer tüm puan türlerinde de yaşın önemli bir etken olduğu
41-50: %2 41-50: %11 41-50: %20 görülmektedir. Ayrıca okullarda sunulan teknik imkânların
>50: %0 >50: %3 >50: %9 ÖSS başarısı üzerinde önemli etkileri tespit edilmiştir.
Özellikle kümeleme analizinde görüleceği üzere öğrencinin
Başarı 89.924 +/- 243.707 +/- 991.693 +/- sahip olduğu sosyal, kültürel ve ekonomik imkânların ÖSS
Sırası-SAY1 94.313 227.146 282.915 başarısına büyük katkısı bulunmaktadır. Sanat derslerine
gösterilen ilginin OBP puanı üzerindeki dikkat çekici etkisi
Başarı 73.375 +/- 313.460 +/- 1.337.283 ve dershaneye gitme oranının başarı üzerindeki etkisinin
Sırası-SAY2 72.515 395.319 +/- 200.858 beklenenden düşük çıkması araştırmanın sonucunda elde
edilen ilginç bulgulardan birkaçıdır.
Başarı 90.707 +/- 645.204 +/- 846.249 +/-
Sırası-SÖZ1 103.714 379.756 327.731 Bu araştırmada, veri madenciliği yöntemlerinden karar
ağaçları ve kümeleme kullanılmış ve sonuçları
Başarı 851.427 +/- 1.380.000 689.051 +/- duyurulmuştur. Yine aynı veri üzerinde birliktelik kuralları
Sırası-SÖZ2 639.406 458.957 (association rules) çıkarsanacak ve sonuçları
duyurulacaktır.
Başarı 61.866 +/- 414.392 +/- 933.528 +/-
Sırası-EA1 61.785 322.084 267.668 6. Teşekkür

Başarı 64.600 +/- 507.498 +/- 953.812 +/- Çalışmaya konu olan verilerin sahibi ÖSYM’ne içtenlikle
Sırası-EA2 65.650 401.745 415.927 teşekkür edilmektedir.

Kardeş Hiç: %8 Hiç: %5 Hiç: %5


Sayısı 1: %51 1: %35 1: %28 Kaynaklar
2-3: %34 2-3: %43 2-3: %46
4-6: %5 4-6: %12 4-6: %15 [1] Tan P.T., Steinbach M. And Kumar V., Introduction to
>7: %0,5 >7: %5 >7: %6 Data Mining. Addison Wesley, Boston, 2006.
[2] Bozkır, A.S., Gök, B., Sezer, E. Üniversite
Evde Var: %47 Var: %35 Var: %27 Öğrencilerinin İnterneti Eğitimsel Amaçlar İçin
Yabancı Dil Yok: %50 Yok: %61 Yok: %61 Kullanmalarını Etkileyen Faktörlerin Veri Madenciliği
Bilen Yöntemleriyle Tespiti, in BUMAT 2008: Bilimde
Yetişkin Modern Yöntemler Sempozyumu, 2008.
[3] Tang Z. and MacLennan J., Data Mining with Sql
Kümeleme sonuçları içersinde en başarılı, en başarısız ve Server 2005. Wiley Publishing Inc, Indiana, 2005.
orta sırada yer alan bu üç küme incelendiğinde bazı ortak [4] Kılanç, B., Türkiye’nin ÖSS Tercihleri, 1.Psikolojik
çıkarımlar şu şekilde listelenmektedir: Danışman ve Veli Bilgilendirme-Yönlendirme
Sempozyumu, 2008.
• En başarılı kabul edilen “Küme 6”, başarı [5] Dolgun, M. Ö., Özdemir, T.G., Deliloğlu, S., Öğrenci
sıralamalarında, sonuç puanları ile orta öğretim Seçme Sınavında (ÖSS) Öğrencilerin Tercih
başarı puanlarında en yüksek başarı aralığını Profillerinin Veri Madenciliği Yöntemleriyle Tespiti, in
yakalamıştır. Tam tersi bir durum Küme 2 için Bilişim” 07 Kongresi, 2007.
geçerlidir. [6] Berberoğlu, G. and Kalender, İ., Öğrenci Başarısının
• OBP, AOBPSAYISAL, AOBPSÖZEL ve AOBPEA Yıllara, Okul Türlerine, Bölgelere Göre İncelenmesi:
ile sınav sonucunda elde edilen puanlar arasında ÖSS ve PISA Analizi, Eğitim Bilimleri ve Uygulama.
yüksek korelasyon mevcuttur. vol. 4, 7, 21-35, 2005.
• Okul öncesi eğitime, ilköğretim ve lisede özel ders
ve dershaneye harcanan zaman yakalanan
başarıyla doğru orantıya sahiptir.
• Bilgisayar ve internet erişiminin yakalanan başarı
üzerinde önemli etkisi görülmemiştir.
• Kardeş sayısı ve lisedeki sınıf mevcudu ile
yakalanan başarı arasında ters orantı olduğu
saptanmıştır.