Skale pomiarowe

SKALE POMIAROWE

Wprowadzenie

Skale pomiarowe są przedmiotem zainteresowania nie tylko diagnostyki pedagogicznej, ale także innych dyscyplin naukowych np. metodologii badań psychologicznych, pedagogicznych i statystyki. Diagnostyka edukacyjna obejmuje pomiar dydaktyczny wykorzystujący różnorodne testy. W związku z tym, że wyniki pomiaru dydaktycznego, które odzwierciedlają poziom osiągnięć szkolnych ucznia, mogą być wyrażone w różny sposób, niezbędne jest zapoznanie się z rodzajami skal pomiarowych. Ponadto dokonam próby objaśnienia zakresu ich użyteczności w kontekście pomiaru dydaktycznego.

Tabela 1. Rodzaje skal pomiarowych (B. Niemierko, 1975; A.S. Reber, 1985; J. Brzeziński, 1997)
Rodzaj skali pomiarowej	Właściwości skali	Przykłady	Zakres użyteczności dla pomiaru dydaktycznego
Skala nominalna (nominal scale)	Najprostsza skala pomiarowa. Jest systemem notacyjnym, pozwalającym na identyfikację, klasyfikowanie i nazywanie poczynionych przez badacza obserwacji. Pozwala na rozróżnianie jakości. Odzwierciedla symbole wskazujące przynależność przedmiotów do pewnych klas jakościowych wyrażonych słownie za pomocą nazw i symboli np. liter lub numerycznie, tj. za pomocą liczb. Jest skalą obejmującą zmienne jakościowe.	Imię i nazwisko ucznia w dzienniku lekcyjnym, płeć ucznia, data urodzenia, data badania diagnostycznego, numery linii tramwajowych, trolejbusowych, numery telefonów, numery graczy, system taksonomiczny w biologii, system nozologiczny w psychiatrii, symbole witamin, symbole grupy krwi, miejsce urodzenia, miejsce zamieszkania, wyznanie religijne	Niski poziom użyteczności. Tylko pewne prace twórcze (np. artystyczne) uczniów dają wyniki, które można grupować, a uporządkowanie ich w grupy według wartości jest ryzykowne.
Skala porządkowa (ordinal scale)	Jest to skala mająca właściwości porządkowe ujawniające się uszeregowaniem obserwacji badacza w obrębie jakiejś dymensji. Jej celem jest ustalenie hierarchi wartości zmiennej. Składa się z symboli - rang odnoszących się do przedmiotów uporządkowanych pod pewnym względem. Rangi określają pozycję danego przedmiotu w zbiorze przedmiotów o charakterze rosnącym lub malejącym. Pozwala na porównywanie przedmiotów między sobą, ale nie można za jej pomocą ustalić wielkości różnic między obiektami.	Stopnie szkolne, stopnie wojskowe, pozycja zajmowana w tabeli rozgrywek ligowych przez drużyną piłkarską, ranking szkół wyższych ustalony w drodze plebiscytu, pozycja socjometryczna ucznia, wyniki turnieju szachowego.	Wyższy poziom użyteczności niż skal nominalnych. Jednakże w związku z tym, że działania arytmetyczne na rangach nie mają uzasadnienia, można jedynie zastosować miary statystyczne dopuszczalne dla skal nominalnych i miary pozycyjne: medianę, centyle itp.
Skala przedziałowa, interwałowa (interval, additive scale)	Składa się z symboli, których pary obrazują różnice między przedmiotami, wyrażone w jednostkach miary. Punkt zerowy zwykle jest umowny (np. temperatura topnienia lodu w skali temperatur Celsjusza). Pozwala na stwierdzenie o ile natężenie zmiennej X dla obiektu A jest większe (mniejsze) od natężenia zmiennej dla obiektu B.	Długość i szerokość geograficzna w stopniach, skale do mierzenia temperatury powietrza (Celsjusza, Fahrenheita), surowe wyniki testowania osiągnięć szkolnych uczniów, wyniki uzyskane w testach inteligencji werbalnej i niewerbalnej, percepcji wzrokowej, świadomości fonologicznej itp.	Jest skalą o wysokim stopniu użyteczności dla pomiaru dydaktycznego. Może być dodatkowo wyrażona normami typu standardowego np. w postaci skali z znormalizowanej, skali T, skali stenowej.
Skala stosunkowa, ilorazowa (ratio, absolute scale)	Składa się z symboli, których pary przedstawiają stosunki wartości przedmiotów. Skala ta ma bezwzględne zero wartości zmiennej. Bywa nazywana skalą metryczną. Pozwala dodatkowo na stwierdzenie, że natężenie zmiennej X dla obiektu A jest k razy większe niż natężenie tej zmiennej dla obiektu B.	Długość, szerokość, wysokość przedmiotów wyrażona w jednostkach miar SI (m, cm, mm, km) lub innych (mila, cal); testy szybkości, wiek niemowląt wyrażony w dniach życia, liczba dzieci w rodzinie	Jest skalą o wysokim stopniu użyteczności dla pomiaru dydaktycznego. Pozwala dostrzec bardziej precyzyjnie różnice intraindywidualne i interindywidualne w zakresie osiągnięć szkolnych uczniów.

SKALE WYNIKÓW ZADAŃ TESTOWYCH

1. Punktowanie 0-1.
Przeważa zwłaszcza w testach: złożonych z zadań zamkniętych, standaryzowanych, pisemnych. Skala 0-1 w zastosowaniu do zadań testowych powinna być uważana za skalę porządkową. Symbol 0 nie oznacza tu absolutnego braku opanowania mierzonej czynności przez ucznia, a jedynie - opanowanie niezadowalające. ĺrednia różnica poziomu opanowania danej czynności - występująca między uzyskującymi punkt za określone zadanie i nie uzyskującymi punktu - nie ma stałej wartości w grupie zadań.
2. Ważone punktowanie dwuwartościowe.
Ważone punktowanie zadań to zróżnicowanie liczby punktów, przyznawanych badanemu za rozwiązanie poszczególnych zadań testowych lub za podanie różnych - prawidłowych i różnych - nieprawidłowych odpowiedzi na to samo zadanie. Ważone punktowanie dwuwartościowe jest punktowaniem 0 - Wi, co znaczy, że badany otrzymuje 0 punktów za podanie błędnej odpowiedzi lub opuszczenie zadania, zaś Wi punktów - za podanie prawidłowej odpowiedzi, przy czym Wi, nazywane wagą zadania, może przybierać różne wartości dla poszczególnych zadań. Jeżeli wagi są dobierane według pojedynczego kryterium, to nadaje się im zwykle wartości kilku początkowych liczb naturalnych: 1, 2, 3, 5. Wagi ułamkowe powstają przy równoległym stosowaniu kilku kryteriów oceny roli zadania w teście lub zastosowaniu statystycznych metod ważenia, opartych na interkorelacji wyników zadań oraz korelacji tych wyników z wybranym kryterium. Ważone punktowanie dwuwartościowe zadań jest bardziej uciążliwe, a zarazem mniej skuteczne niż planowanie testu, które także prowadzi do odpowiedniego wyważenia treści testu w stosunku do programu nauczania.
3. Punktowanie wielowartościowe, ważone lub nieważone.
W zadaniach otwartych - szacowanie jakości odpowiedzi za pomocą skali kilkupunktowej, np. "odpowiedź pełna" - 2 pkt.; "odpowiedź częściowa" - 1 pkt.; "brak odpowiedzi lub błędna odpowiedź" - 0 pkt.
W zadaniach otwartych - punktowanie poszczególnych elementów policzalnych lub możliwych do wyodrębnienia w odpowiedzi na zadanie.
W zadaniach zamkniętych - zróżnicowane punktowanie wyboru poszczególnych odpowiedzi nieprawidłowych (B. Niemierko, 1975).

Na początek