+ Yorum Gönder
Eğitim Arşivi ve Öğrenci odası Forumunda Eğitimde Ölçme Ve Değerlendirme Konusunu Okuyorsunuz..
  1. Uğur Baki
    Devamlı Üye

    Eğitimde Ölçme Ve Değerlendirme








    Eğitimde Ölçme Ve Değerlendirme





    Nesnelerin belli bir özelliğe sahip olup olmadığını, sahip ise; sahip oluş derecesini gözleyip, gözlem sonuçlarını daha çok da sayısal sembollerle ifade etmeye ölçme denir

    Ölçme konusu olan belli bir özelliktir Varlıkların birden çok özelliği vardır Örneğin bir kitabın; boyutu, sayfa sayısı, kağıt kalitesi, içeriği, türü birer özelliktir Ölçme kitabın tümüyle değil, tek bir özelliği ile örneğin sayfa sayısı ile ilgilidir

    Aynı tür varlıklardan-ismi aynı olan varlıkların tüm özellikleri aynı olsaydı; ölçme ihtiyacı olmayacaktı Yediğimiz elmaların tadı, rengi, ağırlığı, fiyatı aynı olsaydı manav elmayı tartmadan standart fiyatıyla pazarlardı Oysa pazarda tadı, rengi, ağırlığı, fiyatı farklı elmalar var Bizim aradığımız özellik hangisinde vardır diye gözlem-ölçme yaparız Sonuç olarak ölçmenin yapılış gerekçesini aynı varlıkların farklı derecelerde özelliklere sahip olmasıyla açıklayabiliriz

    Ağırlık ve uzunluk özelliklerini; kilogram ve metre ile hiçbir aracıya ihtiyaç duymadan doğrudan ölçebiliriz Oysa, kişilik, bilgi, zeka gibi özellikleri doğrudan değil, bireyin veriği tepkiler aracılığı ile ancak dolaylı ölçmek olanaklıdır

    (M) ve (Kg), araçlar evrensel düzeyde kabul gören standart araçlardır Kişilik ve başarı testleri, kulaç, adım gibi ölçme araçları standart olmayan araçlardır

    Standart ölçme aracı kullanılarak doğrudan yapılan ölçmeler gerçeğe çok yakın sonuçlar verir

    Ölçek,farklı anlamları olmakla birlikte daha çok ölçme araçları üzerindeki bölmeleri ya da bir başlangıç noktasından itibaren değişmez bir birimle bölümlenmiş ölçme araçlarını anlatmak için kullanılan terimdir Dört tür ölçek vardır:

    Nesneler arasındaki benzerlik ve ayrılıkları kaba bir biçimde saptamaya yarayan ölçeklere sınıflandırma(nominal) ölçekler denir Öğretmenler- mühendisler diye insanları iki gruba ayırdığımızda sınıflama ölçeğini kullanmış oluruz Her grupta kaç eleman olduğunu(Frekansı), grup üyelerinin toplam içindeki yüzdesini hesaplayabiliriz

    Bir özelliğe sahip oluş derecesi yönünden nesneleri sıraya koymaya yarayan ölçeklere sıralama (dereceleme) ölçekleri denir Temmuz ayı sıcaklık ortalaması en yüksek iller: l Urfa, 2 GAntep, 3 DBakır derken sıralama ölçeği kullanılmış olur Bu ölçekle hangi nesnenin-elemanın diğerinden aranan nitelik açısından daha ileride ya da geride olduğuna bakılabilir Ölçeğin aralıkları eşit değildir Ölçek sonuçları üzerinde; yüzdelik ve medyan (ortanca) hesaplaması yapılabilir

    Sabit bir başlangıç noktası ve aralıkların eşit olduğu termometre, eğitimdeki notlandırma sistemi gibi ölçeklere eşit aralıklı ölçek denir Nesneler arasındaki derece farkı bu ölçekle gösterilebilir, ancak farklar “ katıdır, yarısıdır” biçiminde değer taşımaz 80 puan ile 40 puan arasında 40 puan fark vardır, ancak 80 puan alan öğrenci 40 puan alan öğrencinin iki katı kadar bilgili değildir Bu öçlekle elde edilen sonuçlar üzerinde öncekilere ek olarak; aritmetik ortalama, standart kayma ve pearson çarpım momentleri korelasyonu katsayısı hesaplanabilir

    Başlangıç olarak alınan gerçek bir sıfır noktasıyla başlayıp eşit aralılara bölünmüş ölçeğe eşit oranlı (oranlı) ölçek denir Metre ve kilogramda kullanılan ölçek, eşit oranlı ölçektir Bu ölçek sonuçları üzerinde bütün istatistik işlemler yapılabilir



    Ölçme, bir gözlem işidir Belli niteliklerin var olup olmadığı, var iseler ne kadar oldukları ile ilgili bir gözlemdir Bu haliyle ölçme sonuçları anlamlı değildir O sonuçların yorumlanması gerekir Yorum için ölçme sonuçlarını kıyaslayabileceğimiz insanların çoğunluğunca kabul göre ortak değerlere-ölçütlere ihtiyaç bulunmaktadır Ölçme sonuçları ile ölçüt karşılaştırılarak o sonuçların iyi mi-kötü mü, yeterli mi yetersiz mi, az mı çok mu olduğuna karar verilir Bu son işlemi değerlendirme olarak kabul ederiz Değerlendirmenin başarısı: (a) Ölçme sonuçlarının gerçeğe uygunluk derecesine, ölçütün ne ölçüde kabul gördüğüne ve © kıyaslamada akıl yürütme hatası yapılmamış olmasına bağlıdır

    Eğitimde değişik ölçütler kullanılabilirınıf başarısı, öğretmenin bilgisi ya da kitabın yazdıkları, standart ölçütler(10’luk, 100’lük not düzenleri),öğrencinin yeteneği, program hedefleri, öğrencinin programa başladığındaki düzeyi(ME Bakanlığı şu sıralar daha çok program hedeflerini ölçüt olarak almaktadır) Değerlendirilecek grup dikkate alınmadan hazırlanan ölçütlere mutlak, ölçme işlemi bittikten sonra grup gözönüne alınarak hazırlanan ölçütlere ise bağıl ölçüt denir

    Değerlendirmeyi; tanıma ve yerleştirmeye, biçimlendirme ve yetiştirmeye, değer biçmeye yönelik değerlendirme olarak sınıflandırmak olanaklıdır



    Ölçme Araçlarında Bulunması Gereken Nitelikler

    Ölçme ve değerlendirme, karar vermek için yapılır Kararların beklentileri karşılaması bu iki sürecin iyi işlemesine bağlıdır Ama, ölçmenin yapıldığı ortam, ölçülen niteliğin (değişkenliği,somutluk derecesi) durumu, ölçme yapan kişinin aracı kullanmadaki becerisi, hepsinden de önemlisi ölçme aracının nitelikleri ölçme sonuçlarının doğruluğunu ve güvenirliğini etkiler O halde iyi bir karar için ölçme araçları şu nitelikleri taşıyor olmalıdır:

    AGeçerlik: Ölçme aracının niteliği tam ve doğru, eksiksiz-fazlasız olarak ölçmesidir Sadece hedeflediği özelliği dikkate almasıdır Özelliği ölçmeye uygun araç olmasıdır50 puanlık Türkçe bilgisi olan öğrenciyi 60 puan veren test geçerli değildir Türkçe testi içinde Tarih dersine ilişkin bilgileri yoklayan test, geçerli değildir Başarıyı ölçmek için hazırlanan test, kişiliği ölçmek için geçerli değildir

    Bir ölçme aracı,ölçülecek niteliklerin tamamını ölçüyorsa ya da iyi bir örneklem üzerinde ölçme yapmışsa; kapsadığı her madde geçerli ölçüm yapıyorsa kapsam geçerliği var demektir

    Bir testten elde edilen puanlarla, o puanı alan öğrencinin sonraki zamanlarda gösterdiği başarı birbirine uyuyorsa yordama geçerliğinin varlığı söylenebilir

    “Yapı,birbirleriyle ilgili olan öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür”Yapı geçerliği ise, testin bir niteliği hem genel hem de öğeleriyle bir bütün olması ve niteliği doğru bir biçimde ölçme özelliği taşımasıdır

    Hazırlanırken bir test hangi alanla ilgili olduğu belirtilmişse; o alanla ilgili maddeleri içermesidir Örneğin, bir Fizik testi Matematik bilgisini ölçme hedefli sorular (maddeler) içermemelidir Testin bu özelliğine görünüş geçerliği denir

    B Güvenirlik:Bir ölçme aracının aynı niteliği arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonuçlarla ölçmesine güvenirlik denir Bir kğ’lık bir ağırlığı aynı terazi ilk defasında 1 kğ, ikinci defa 1,2 kğ ,üçücü defa 1,1 kğ ölçüyorsa o terazinin güvenilir olmadığını söyleriz Ancak, daha önce belirtilen çeşitli hata faktörleri sonraki ölçümlerin farklı çıkmasına neden olabilir

    Kimi ölçme araçları sürekli olarak aynı miktarda hatalar yapar Bu araçların yaptığı hata, sabit hatadır Bazı araçlar sadece belli koşullarda hata yaparlar Örneğin öğretmenler güzel yazılmış kağıtlara daha çok puan verirler Bu tür hatalara sistemli hata denir Kimi hatalar da şansla ortaya çıkar, ne yönde etki ettiği tahmin edilmez Bu hatalara da rasgele hata denir

    İki değişken arasındaki ilişki (korelasyon) (+100) ile (-100) arasında değişir Güvenirlik katsayısı ise (000) ile (+100) arasında değerler alır Hata azaldıkça güvenirlik katsayısı (+100) a yaklaşır

    Bir testin güvenirliğini anlamada dört yoldan biri kullanılır: (1) Bir test aralıklı olarak iki kez kullnılır (2) Eşdeğer iki test hazırlanır ve ard arda uygulanır (3) Yarılama yöntemi adı verilen test türünde sorular iki eşit gruba ayrılır (tek ve çift sorular) testin bir yarısından alınan puan diğer yarısından alınan puana yakınsa test güvenilirdir(4)KR-20 ve 21 formülü ile testin her bir maddesinin testin tümüyle uyumluluk derecesi saptanmaya çalışılır Bu dört yöntemde de güvenirlik katsayısının (+100)’ a yakın olması güvenirliğin yüksek olduğunu gösterir

    Testteki soru sayısı arttıkça, doğru cevabı tahminle bulma olasılığı azaldıkça güvenirlik artar Testin yönergesi varsa, sorular açık ve anlaşılır ise güvenirlik artarBir testin ölçtüğü davranışlar homojenlik gösteriyorsa, soruların, uygulama ve puanlama güvenirliği bulunuyorsa o test güvenilirdir Tetsin uygulanışında öğrenciler açısından farklılıklar olmamalıdır

    C Kullanışlılık:Testin hazırlanmasının, uygulanmasının, puanlanmasının kolay olması; az zaman, az emek, az masraf gerektirmesidir

    Ayırtedicilik:Bir testin başarılı olanla olmayanı birbirinden ayırtedecek biçimde sonuçlar vemesidir Ölçme aracının aranan nitelikler arasınaki farkı ortaya koyabilme becerisidir

    Puanlama Güvenirliği-Objektifliği:Puanlayanlar değişse de verilen puanların değişmemesidir

    Geçerlik, bir testin en temel özelliğidir Bir test güvenilir ama geçerli olmayabilir



    TESTLER VE SINIFLANDIRILMASI

    Birey hakkında verilen kararların geçerliği; elde edilen verilerin kapsamlı, doğru ve sayısal olmasına bağlıdır Kişilerle ilgili kararlarımız daha çok onları nasıl anlayabileceğimiz noktasına yoğunlaşır Bireyleri tanıyabilmek için:

    - Vak’a kayıtlar, kontrol listeleri, dereceleme ölçekleri, otobiyografi-biyografi gibi bilgi toplama teknikleri kullanılabilir

    - Bireyler, yeri ve zamanı belli test durumlarına sokulabilir

    Eğiti-öğretim dışında deneme, deney, kontrol, yoklama gibi anlamlarda kullanılan test;

    “bireylerin kimi özelliklerini ölçmek üzere kullanılan ölçme aracıdır” (( Test sözcüğü yanlış olarak; çoktan seçmeli testler yerine ya da sınav sözcüğü anlamında kullanılmaktadır)

    Testleri farklı ölçütlere göre; farklı biçimlerde sınıflandırmak olanaklıdır Yine da eğiti-öğretim alanında testleri aşağıdaki biçimde sınıflamak daha doğrudur

    Maksimum Yeterlik Testleri



    A Yetenek Testleri

    1 Genel Yetenek Testleri

    2 Özel Yetenek Testleri

    B Başarı Testleri

    1Standart Testler

    2Öğretmen Yapımı Testler





    a Grup ve bireysel testler

    b Hız ve güç testleri

    c Objektif testleri

    d Dile dayalı olan ve dile dayalı olmayan testler



    Maksimum yeterlik testi, kişinin belli bir durumda, belli bir işi ne denli doğru yapabildiğini belirlemek amacıyla geliştirilen testtir

    Yetenek testleri, doğuştan getirilen, çevrece geliştirilen zihin ve beden gücünü ölçen testtir

    Zeka testi, zeka tanımına-anlayışına uygun testlerdir Kimi bilgiye, kimi mantığa, kimi yaratıcılığa ağırlık verir

    Standart testler, ülke çapında, giderek evrensel düzeyde uygulanan,eğitim programlarını esas alan, objektif soru türlerini kullanan, uzmanların hazırladığı, geçerlik ve güvenirliği yüksek testlerdir

    Öğretmen yapısı testler, standart testlerin olumlu özelliklerinden bir çoğundan yoksundur Bu araçların niteliği büyük ölçüde öğretmenlerin bilgi ve becerisine bağlıdır



    TEST PLANI

    Geçerli ve güvenilir ölçme sonuçları; testlerin geliştirilmesi, uygulanması ve puanlanmasının açık ve ayrıntılı biçimde planlanmasına bağlıdır Bir test planında aşağıda belirtilen soru başlıklarının karşılıkları verilmiş olmalıdır

    1 Sınavın amacı belirtilmelidir Bu amaç: Başarı durumunun tesbiti, eleme, yordama,öğrenme eksikliklerini görme olabilir

    2 Hangi hedef ve davranışların yoklanacağı ortaya konulmalıdır

    3 Nasıl bir ölçme aracı kullanılacağına (sözlü, klasik yazılı, uygulama) karar verilmelidir

    4 Konuların-hedef davranışların toplam öğrenilenler içindeki payı belirlenmelidir Bunun için yüzdelik ya da o konuların kaynaktaki sayfa sayısı dikkate alınabilir

    5 Toplam kaç soru sorulacağı, soruların davranışlara nasıl dağıtılacağı kararlaştırılmalıdır

    6 Bir soru 100 kişilik öğrenci grubunda kaç öğrenci tarafından doğru olarak yapılacaktır/yapılmalıdır Testin bu özelliğine güçlük derecesi denir Başarı testlerindeki bir sorunun güçlük derecesi 0,50 olmalıdır Ancak, eleme amaçlı testlerde bu oran 0,10-0,05 gibi aralıklara düşürülmelidir Güçlük sorunun yokladığı davranış öğrenilmesindeki karmaşıklıkla ilgili olmalıdır Bazen de sorudaki ifadenin anlaşılmazlığı, yönerge eksikliği gibi nedenler de soruların güçlük derecesini artırabilir Bir testte sorular kolay sorulardan başlanarak sıralanmalıdır

    7 Puanlama biçimi(her soruya verilecek puan) ve puanlamanın nasıl yapılacağına (öğretmen tarafından, komisyon eliyle, optik okuyucu ile) karar verilmelidir

    8 Yanlış ya da eksik cevaplar için bir düzeltme yapılacak mıdır? (Seçenekli sorularda, seçenek sayısından bir eksik yanlış cevap için bir doğru cevap düşürülür) Sorusuna karşılık verilmeli ve bu durum yönergeye yazılmalıdır

    9 Test nerede uygulanacak, kimler uygulayacak, ne kadar süre verilecektir, evrakın taşınması,dağıtılması toplanması nasıl olacaktır? Soruların yanıtları verilmelidir



    MAKSİMUM YETERLİK TESTLERİ

    Klasik Yazılılar( essey, kompozisyon tip yazılılar): Yanıtının uzunca yazmayı gerekli olduğu, analiz, sentez ve değerlendirme düzeylerindeki bilgileri yoklamaya elverişli teste klasik yazılı denir

    Cevabı düşünüp bulma, sentez yapma, özgürce ifade etme olanağı veren bir araçtır Düşünme, organize etme, yaratıcılığını kullanma, kendini yazılı olarak anlatabilme olanaklarını veren test türüdür

    Öğretmen için hazırlaması ve uygulaması kolaydır

    Ancak öğrencilerin cevaplaması uzun zaman alır, kapsam geçerliği azdır Puanlama objektifliği yoktur Geçerlik ve güvenirliği düşüktür

    Sakıncalarını azaltmak için açık kitap yazılıları ile seçimlik sorulu yazılıları gerekli olmadıkça kullanmaktan kaçınmalıdır Sorular önceden cevap anahtarı hazırlanarak, soru soru okunmalıdır



    Sözlüler:Başarıyı ölçmede kullanılan en eski araçtır Eski önemini yitirmekle birlikte başta Türkçe, Y Dil, Müzik, B Eğitimi dersleri olmak üzere bir çok derste tercih edilmeye devam etmektedir

    Derinlemesine (analiz, sentez, değerlendirme düzeylerinde) bilgi yoklama olanağı vardır Öğrenci kişiliğinin tanınmasına yardım eder, hazırlanması kolaydır ve ekonomik bir araçtır

    Ancak, her öğrenciye farklı sorular sorulur, çok zaman alır, soru sayısı azdır(kapsam geçerliği yoktur) puanlaması objektif değildir

    Sözlü sınavlar ya dönem boyunca, ya da bir defada yapılır Hangi durumda yapılırsa yapılsın; yoklanacak davranışların bir listesi çıkarılmalıdır Sorular ve puanlama önceden belirlenmelidir



    Kısa Cevaplı Testler: Cevabı bir sözcük, tarih ya da cümle olan; yazmayı gerektiren testlerdir Soru cümlesi ya da eksik cümle biçimlerinde olabilir

    Kapsam geçerliği ve puanlama objektifliği olan araçlardır Hazırlanması kolaydır Tahmin ederek doğru cevaplar bulunamaz

    Bu testlerde yazı yazma; D-Y ve çoktan seçmeli testlere göre daha çok zaman alır Hatırlama-bilgi düzeyindeki davranışlar yoklanır

    Testin etkili olabilmesi için: Her madde bir tek davranışı yoklamalı, doldurmalı biçiminde boşluklar eşit mesafede olmalı, farklı anlamlara gelebilecek ifadelerden kaçınılmalıdır



    Eşleştirmeli Maddeler: İki grup halinde verilen ve birbirleriyle ilgili olan öğelerin, belli bir açıklamaya göre; örneğin, terimlerle- anlamlarının, yazarlarla –eserlerinin eşleştirilmesi biçiminde kullanılan başarıyı ölçme aracıdır

    Genellikle yüzeysel bilgileri yoklayan bu testteki bir madde ile birkaç çoktan seçmeli test sorusunun yaptığı iş aynı düzeyde sayılabilir Eşleştirmeli maddelerde; soru kökünün bulunduğu bölüm “öncüller”, yanıtların bulunduğu bölüm ise “seçenekler”dir

    Bu tür testlerin etkili olabilmesi için: öncül ve seçenekler homojen olmalı, madde sayısı 6-15 arasında bulunmalı, rakamlar ve harfler alfabetik sıraya göre yazılmalı, seçeneklerdeki madde sayısı öncüllerden daha çok olmalıdır Eşleştirmeli soru tipini tek başına değil, D-Y , çoktan seçmeli, kısa cevaplı testlerle birlikte kullanmalıdır Testin kapsam geçerliği ve puanlama objektifliği olduğu söylenebilir



    Doğru-Yanlış Testler:Cevaplayıcının verilen cümleyi doğru ya da yanlış olarak sınıflaması biçiminde hazırlanıp uygulanan başarı testidir

    Bu test türünde bilmeden doğru cevabı bulma oranı % 50’dir Öğrencinin yanlışın neden yanlış olduğunu bilmesine gerek yoktur Yanlış cümlelerin biliçaltında doğru gibi yerleşmesi olasılığı vardır İleri düzeyde bilgi ölçmeye elverişli değildir

    Belirtilen eksikliklerine karşılık D-Y testlerinin; cevaplaması kolaydır ve az zaman alır Puanlaması kolay ve objektiftir

    Bu tür sorularda “daima, asla, bütün, hiçbir,yalnız” gibi sözcükler kullanılmamalıdır Cümleler yalın olmalı, doğru ve yanlış cümlelerin sayısı eşit olmalı, puanlamada düzeltmeye yer verilmelidir



    Çoktan Seçmeli Testler:Madde kökü ve seçeneklerden ( doğru cevap ve çeldiriciler) oluşan başarıyı ölçme aracıdır

    Çok sayıda soru sorma olanağı vardır, bu nedenle kapsam geçerliği yüksektir Hazırlanması zordur, uzmanlık gerektirir Ancak, cevaplaması ve puanlaması kolaydır Optik okuyucular puanlamada kullanılabilmektedir Uzmanlar görev aldığında bilginin her düzeyinde soru hazırlamak olanaklıdır

    Bu test biçiminin yetersizlikleri: Yaratıcılık, sentez, değerlendirme, kompoze etme, özelliklerini ölçememesi, tahminle doğru cevabın bulunması sayılabilir



    HEDEFLERİN AŞAMALI SINIFLAMASI VE BU SINIFLAMAYA UYGUN TEST YAZMA

    Madde, bir davranışın varolup olmadığını, varsa derecesini yoklamadır Yoklanan davranış önemli ve gözlenebilir olmalıdır Ve o davranışa uygun ölçme aracı seçilmelidir

    Bloom ve arkadaşları eğitim yoluyla öğrencilere kazandırılabilecek davranışları üçe ayırmıştır Bunlar bilişsel, duyuşsal ve psikomotor davranışlardır Onlar bir davranışın hangi alana ait olduğunun ölçütlerini belirlemekle kalmamıştır O alan içinde ne kadar ağırlıklı olduğu, derinliği de yapılan sıralama ile ortaya konulmuştur

    Farklı alanlara ait davranışların kazandırılması için farklı yöntemlerin kullanılması, farklı biçimlerde değerlendirmelerin yapılması gerekir Yine bir alandaki farklı düzeydeki davranışların kazandırılması ve ölçülmesi de doğal olarak farklı olacaktır



    Bilişsel Davranışlar: Bilgi ve bilgiden doğan zihinsel yeteneklerle becerileri kapsar Bu alanın alt basamakları: Bilgi, kavrama, uygulama, analiz, sentez ve değerlendirmedir Öğretmenler, bilgi düzeyinden değerlendirme düzeyine gidildikçe öğrenme derecesinin arttığını ve her bir aşama ile ilgili madde tipinin nasıl olması gerektiğini bilmelidir Birer örnek vererek bu düzeylerde hazırlanan soruları örneklendirelim:

    “Öğrencilerin bilgisini ölçmeye yarayan araca ne ad verilir?” -( Bilgi düzeyi)

    “Güvenirlik; geçerlik için gerekli ama yeterli değildir ifadesinin anlamı nedir?”-(Kavrama düzeyi)

    “1:200 000 ölçekli haritada 10 cm’lik uzaklık gerçekte kaç kilometredir”- (Uygulama düzeyi)

    “metninin ana fikrini, olaylarını, kişilerini, alt düşüncelerini söyleyiniz”- (Analiz düzeyi)

    “Karışık olarak verilen 10 anahtar sözcük yardımıyla anlamlı bir yazı yazınız” (Sentez düzeyi)

    “İnsanın sanatçı ruhunun oluşmasında tiyatro mu, sinema mı daha etkilidir?”- (Değerlendirme düzeyi)



    Duyuşsal Alan: İlgi, tutum ve değer vermeyle ilgili davranışları kapsar Örnek soru:”Mimar Sinan’ın Osmanlı Sanat ve Kültürüne olan katkısını anlatınız”



    Psikomotor Alan:Beyin ve organların koordinasyonu ile yapılan davranışları kapsar Örnek:” Uygun malzemeleri kullanarak 10 dakikada 4 kişilik omlet yapınız”





    TEST VE MADDE ANALİZİ

    Bir testte yer alacak maddeleri seçme işine; madde analizi denir Madde analizinde yapılacak ilk işlemlerden biri ön denemedir Bu yolla: Kolay-zor maddeler, amaca uygun güçlükteki maddeler, maddeleri ayırtetme gücü, testte kullanılacak madde sayısı,verilecek zaman, yönergenin şekillenmesi sağlanabilir



    Test Puanının Analizi:Testin uygulama sonuçlarına bakarak şu konularda yargılara varılabilir: (1) Puanların; ranjı, standart kayması, dağılımın çarpıklık öçlüsü, (2) Testin ortalama puanı, (3) Testte boş bırakılan ya da erişilemeyen maddeler

    Ranj: Dizideki en büyük puan ile en küçük puan arasındaki farktır Ranj arttıkça testin ayırt ediciliği artar, dolayısıyla güvenirlik yükselir Standart kayma büyüdükçe güvenirlik artar Ranj/ Standart Kayma= 4-6 olmalıdır

    Çarpıklık Değeri: Bu değer 3(AOrtalama- Medyan)/Standart Kayma formülüyle bulunur Çıkan sonuç; negatif ise test kolay, pozitif ise zor, 0,10< ise hafif zor, 0,10-0,25 arası ise orta derecede zor, 0,25> ise çok zordur

    Madde Güçlük Derecesi: Bu değer maddeye doğru cevap verenlerin sayısının toplam öğrenci sayısına bölünmesiyle bulunur Madde güçlük indeksi, 0 ile 41 arasında değişir Değer 0’ a yaklaştıkça madde zor, + 1’ e yaklaştıkça kolaydır Başarı testlerinde 0,50 güçlük değerinde maddeler kullanılması önerilmektedir

    Başarının 0,50’nin altında olması ;bilinen nedenlerin yanında1) yönergenin iyi hazırlanmamasına, (2) madde kökünün açık olmamasına, (3) şıklar arasında doğru cevabın bulunmamasına bağlanabilir

    Madde Ayırt Edicilik Gücü: Bu değerin hesaplanmasında %27 lik en üst grup ile %27’lik en alt grup dikkate alınır Üst gruptaki doğru cevap veren öğrenci sayısından alt grupta doğru cevap veren öğrenci sayısı çıkarılıp; toplam öğrenci sayısına bölündüğünde madde güçlük gücü bulunmuş olur Bu değer de –1 ile + 1 arasında değişir 0,40 ayrtediciliği oldukça iyi maddeyi anlatır 0,30-0,39 iyi, 0,20-0,29 düzeltilmesi gereken soru, < 0,19 kullanılmaz soru anlamındadır

    Madde Analizi: Maddeler işe yarar mıdır? İşe yaramıyorsa niçin yaramamıştır? Maddede ne tür düzeltmeler yapılabilir? Gibi soruların cevaplarının alınması madde analizidir Madde analizi, onun kullanılış amacıyla da ilgilidir Deneme grubu ile testin uygulanacağı grubun benzerliği madde analizinde önemli bir önkoşuldur Her bir maddenin analiz yoluyla: güçlük derecesi, ayırt ediciliği, çeldiricilerinin iyi çalışıp çalışmadığı, köklerinin iyi anlaşılıp anlaşılmadığı sorgulanır Madde analizi; bir grubu iki denk kümeye ayırarak karşılaştırmalarla geliştirilebilir





    TEST PUANLARI ÜZERİNDE İSTATİSTİKSEL İŞLEMLER

    Değerlendirmeye esas olan veriler ya ölçme yoluyla ya da gözlem yoluyla elde edilir “Ruken, sınıfın en çalışkanıdır” ifadesi gözleme dayalı bir değerlendirmedir “Ruken, 100 puan üzerinden 98 aldı, o çalışkandır” ifadesi ise ölçmeye dayalı(sayısal) bir değerlendirmedir Ölçmeye dayalı veriler güvenilir olduğu kadar üzerinde istatistik işlemler yapmaya da elverişlidir Ölçme verileri istatistiksel yollardan incelenirken sırayla kimi işlemler yapılır Bu işlemler:



    1Verilerin büyükten küçüğe doğru sıralanması, çok sayıda veri varsa gruplamaya gidilmesi: Karışık olarak sıralanan verilerden bir anlam çıkarmak mümkün değildir Sıraya dizilen( dağılım halinde gösterilen) puanlara bakarak en iyilerin en yetersizlerin kimler olduğu hemen anlaşılabilir Veri sayısı çoksa art arda gelen veriler bir grupta toplanabilir Bunun için öncelikle grup sayısı,10-20 arasında olmalıdır ama 9-11-13-15 gibi tek sayılı bir rakam olması istatistik işlemler için daha uygundur Grup aralığının da tek rakamlı(5,7,9 gibi) olması çalışmaları kolaylaştırır Dağılımın ranjı bulunur, kararlaştırılan grup sayısına bölünerek grup aralığı hesaplanır Örnek,dağılımın en yüksek puanı 91, en küçük puanı 20 olsun Ranj: 91-20=71 ve grup sayısının 15 olmasını istiyorsak; 71:15=4,7 den düz hesap 5,grup aralığıdır



    2Frekans Dağılımını Çıkarmak ve Dağılımı Grafikle Göstermekağılımdaki her puanın kaç kez tekrar ettiğini gösteren sayı, frekanstır Örneğin YDil dersinden 75 puanını 3, 70 puanını 4 kişi almış derken; 3 ve 4 sayıları frekans değeridir Ham puanlardan doğrudan frekanslara gidilmez Öncelikle / ( çetele)işareti kullanılarak toplam tekrar sayıları bulunur Frekans dağılımına bakarak genel dağılım; sütün ya da çizgi grafiği ile özetlenir Frekanslar x, puanlar y ekseninde gösterilirGrafikler ölçme sonucunu kestirmeden anlamaya ve anlatmaya hizmet eder

    Dizinin altından başlanarak üste doğru frekansların toplanmasıyla oluşan frekanslara yığmalı frekans denir Yığmalı frekans, yüzdelik hesaplamada bulunması gereken bir değerdir

    3Merkezi Eğilim Ölçüleri (ortalama) ile Yüzdelikleri Hesaplama:Bir dizideki puanların tümünü temsil eden tipik sayılabilecek değer veya ölçülerdir

    ModTepedeğer) Bir dizinin mod’u en yüksek olan puan değeridir Dizi hakkında hemen bir fikir edinme olanağını verir Bir dizide birden çok mod değeri olabilir

    Medyan ortanca) Bir diziyi ikiye bölen noktaya isabet eden değerdir Dizide ortalamayı etkileyecek uç değerler bulunması halinde medyan, en güvenilir ortalama ölçüsüdür Eldeki puanlar tekse; ortadaki puan medyandır Eğer puanlar çift ise, ortadaki iki puanın ortalaması kabaca medyanı verir Örneğin, yaşları 6, 10, 25, 30, 45, 55 ve 70 olan bir ailenin oluşturduğu dizinin medyanı, ortadaki 30 puanıdır Diziye 80 yaş eklenmiş olsaydı medyan 38 olurdu( Medyan dizide bulunmayan bir puan olabilir)

    Aritmetik Ortalama (mean): Daha çok homojen gruplarda kullanılan ölçüdür Puanlar toplamı, puan sayısına bölünerek bulunur Frekans değerleri bulunmuş dizilerde kısaca frekans değerleriyle puanlar çarpılıp toplam, frekans toplamına bölünür Dizideki her puanın ortalamaya yansımasını istediğimiz hallerde aritmetik ortalamaya başvurulur Gruplanmış dizilerde aralık değeri frekansla çarpılır, toplamlar frekans sayısına bölünerek aritmetik ortalama bulunur

    Ağırlıklı Ortalama: Puanlara farklı ağırlıklar verilmesi durumunda aritmetik ortalama yerine ağırlıklı ortalama kullanılır Örneğin vizenin ağırlığı %30, finalinki %70 olsun Öğrencinin vize notu 60, final notu 50 ise; ağırlıklı ortalama =( 30x60)+(70x50)/30+70’tir

    Yüzdelikler:Bir dağılımın belirli bir yüzdesini altında bırakan noktadır “Yüzde” terimi ile karıştırmamak gerekir Yüzde, belirli bir miktarı ya da alanı; yüzdelik ise, altında ya da üstünde belli oranlarda ölçümler bırakan bir noktanın değerini belirtir Örneğin 10 Yüzdelik(Y10): ölçümlerin 0,10 unu altında, 0,90 ını üstünde bırakan değeri anlatır ÖSS’de bir puanın hangi yüzdelik içinde olduğu belirtilerek öğrencilere puanlarından daha anlamlı bir değer verilmektedir Yüzdeliklerde çeyrek, medyan ve üçüncü çeyrek yüzdelikler grubun anlaşılmasına hizmet etmektedir

    Yüzdeliğin hesaplanmasında şu formül uygulanır: Yüzdelik=Puanın karşısındaki yığmalı frekans/ toplam frekans x 100



    4 Dağılım (Yayılma) Ölçüleri: İki ayrı puan dizisinin aritmetik ortalamaları aynı olabilir ama dağılımlar birbirine benzemeyebilir Örneğin 1 Grup puanlar:5,6,6,7 ve 2 Grup puanlar 2,3,6,9,10 olsun Her iki grubun AOrtalaması:6’dır Ama grupların ilk bakıştan birbirinden farklı olduğu görülmektedir

    Ranj(dizi genişliği): Bir dağılımdaki puanların en büyüğü ile en küçüğü arasındaki farktır Dağılımın homojen puanlardan oluşup oluşmadığını gösterir Yukarıda verilen 1 Grubun ranjı:7-5=2, diğer grubun ranjı ise10-2=8 dir

    Çeyrek Kayma: Bir dağılımdaki %75 Nokta ile %25 nokta arasındaki genişliğin yarısına çeyrek kayma denir Dizideki %50 Nokta, medyandır Çeyrek kayma, medyan etrafındaki iki çeyrek nokta arasındaki ortalama açıklığı temsil eder Çeyrek kayma, dağılımın belirgin biçimde sağa ya da sola eğilimli olması halinde kullanılan bir dağılım ölçüsüdür Yüzdelik hesaplama formülünü kullanarak 1 ve 3 Çeyrekler bulunduğunda; çeyrek kayma iki değer arasındaki farkın yarısı olarak elde edilebilir

    Standart Kayma:Yayılma ölçüleri arasında en güvenilir olanı ve en yaygın kullanılanı standart kaymadır Ortalama ölçüsü olarak aritmetik ortalamanın kullanıldığı dağılımlar için standart kayma kullanılır Hesaplanması: Dağılımın aritmetik ortalamasından, puanlar farkının, karelerinin, toplamının, karekökünün bulunması ile yapılır Örneğin 2,4,6,8,10,12 dağılımını AOrtl=7’dir Puanların AOrtalamadan kaymaları:-5,-3,-1,1,3, ve 5’tir Kaymaların karesi:25,9,1,1,9, ve 25’tirBunların toplamı 70 ve aritmetik ortalaması 70/6 (puan sayısı)=11,6’dır 11,6’nın karekökü olan 3,4’ise standart kaymadır

    Standart kaymanın yorumlanmasında normal dağılım eğrisinden yararlanılabilir Normal dağılımda bütün ortalama ölçüleri (mod, medyan, aritmetik ortalama) aynı nokta (0 ) üzerine düşer Ortalama noktası dağılımı ikiye böler Dağılım alanı “-3,-2,-1,0,+1,+2, ve+3” biçiminde 6 standart kayma (sigma) ile bölünür Puanların 2/3’ü (%68’i) ortadaki –1 ve +1 standart kaymaları arasında bulunur



    KAYNAKLAR:

    Tekin, Halil (1996) Eğitimde Ölçme ve Değerlendirme, 9 Baskı, Yargı Yayınları, Ankara

    Yıldırım, Cemal (1983) Eğitimde Ölçme ve Değerlendirme-Öğretmenler İçin el Kitabı,ÖSYM Yayınları, Ankara







  2. Acil

    Eğitimde Ölçme Ve Değerlendirme isimli yazıya yorum yazın.





  3. Sponsor Bağlantılar
+ Yorum Gönder


ölçme ve değerlendirme final soruları