Az értékelés nem más, mint a célok és az eredmények összevetése, az eredmények vizsgálata abból a szempontból, hogy céljaink szerint minek kellett volna eredményként létrejönnie. A pedagógiai értékelésnek ez a fogalma nagyon tág. Magába foglalhatja egyebek mellett a tanulók neveltségi szintjének, a tanár munkájának, egy egész iskola vagy több iskola munkájának, a tantervnek, a taneszközöknek stb. az értékelését. Most mindezzel nem foglalkozunk, figyelmünket egyedül a tanulói teljesítmények értékelésére összpontosítjuk. Ez is kétféle lehet: egyfelől vizsgálhatjuk az egyes tanuló teljesítményét, és ilyenkor az érdekel bennünket, hogy XY személy szerint milyen teljesítményt mutat. Másfelől vizsgálhatjuk sok tanuló teljesítményét statisztikai módszerekkel: ebben az esetben nem az egyéni eredmények, hanem a statisztikai átlageredmények lesznek az érdekesek.
Az egyes tanuló teljesítményét alapvetően háromféle célból vizsgálhatjuk, és ennek megfelelően három teljesen különböző dologra gondolhatunk, amikor iskolai értékelésről beszélünk.
Ezek nagyon különböző funkciók, és ezért külön szócikkekben írunk róluk, ugyanakkor van néhány összefüggés, amely általában igaz a pedagógiai értékelésre.
Az értékelés során mindig összehasonlítunk valamit valami mással. Mit mivel? Természetesen a teljesítményeket a követelményekkel – mondhatnánk. Ez igaz is, de a dolog néha bonyolultabb. Lássuk a viszonyítás néhány alapesetét!
Az értékelés nem mindig számszerű. Minőségi (kvalitatív) értékelésről akkor beszélünk, amikor verbálisan, nyelvi kifejezések segítségével határozzuk meg a tanuló teljesítményét. A helyzettől függően ez lehet szóbeli vagy írásos, az utóbbit szokták szöveges értékelésnek is nevezni. A kvalitatív értékelés sokszor könnyebben értelmezhető és információban gazdagabb, mint a számszerű (kvantitatív) értékelés, a minősítő értékelés azonban nem tudja betölteni a funkcióját (a tanulók teljesítményének összehasonlítását), ha nem tartalmaz számszerű elemeket. De a fejlesztő értékelés sem tudja megkerülni a számszerűséget, ha a tanulás célja a minősítő értékelésen való sikeres szereplés. (Ha pl. nyelvvizsgára készülünk, hasznos időnként számszerűen is megmérni a tudásunkat, hogy ilyen módon visszajelzést kapjunk arról, milyen messze van még a cél.)
Ha számokkal akarjuk kifejezni az értékelés eredményét (mennyiségi értékelés), akkor szembe kell néznünk a mérésmetodológia szigorú elvárásaival. Minél inkább megfelel az értékelés módszere ezeknek az elvárásoknak, annál inkább beszélhetünk mérésről. Ellenkező esetben az értékelés számszerű eredménye csak becslés. Becslés és mérés között tehát nincs szigorú határ, inkább arról van szó, hogy milyen mértékben sikerül alkalmazni a méréssel szemben támasztott követelményeket. Egy szokásos szóbeli felelet osztályzattal történő értékelése pl. aligha nevezhető mérésnek, de a szóbeli érettségi értékelése már ellenőrzöttebb körülmények között történik, ezért nem puszta becslés. Az írásbeli tudásszintmérő tesztektől pedig joggal elvárható, hogy megfeleljenek a mérések következő jóságmutatóinak.
A mérőeszköznek (tesztnek) mindenekelőtt objektívnak kell lenni, azaz alkalmasnak kell lennie arra, hogy a lehetőség szerint kiszűrje az értékelő személyéből fakadó szubjektív szándékokat, részrehajlásokat. A szubjektív eltéréseknek különféle okai lehetnek. Származhatnak az értékelő és az értékelt közötti személyes viszonyból: a vonzalmak és az ellenszenvek egyaránt akadályozhatják az objektív megítélést. Származhatnak az értékelő tudatos vagy tudattalan, pozitív vagy negatív előítéleteiből: a vizsgált személyek bizonyos tulajdonságai pozitív vagy negatív érzelmeket kelthetnek az értékelőben – akkor is, ha egyébként nem ismerik egymást. Végül a szubjektivitás nemcsak a vizsgált személyre vonatkozhat, hanem jelentheti az értékelő személy önkényes feladatértelmezését, személyes prioritásait is.
A kérdés az, hogy az adott mérőeszköz mennyire alkalmas az ilyen szubjektív faktorok kiszűrésére. Általánosan elterjedt nézet, hogy az írásbeli feladatok objektívabbak, mint a szóbeliek, különösen ha az anonimitást is sikerül biztosítani. Ilyen esetben is befolyásoló lehet azonban pl. az íráskép, kivéve, ha feleletválasztásos tesztről van szó. Könnyebb az objektivitást biztosítani ismeretek egyszerű reprodukálását igénylő feladatokkal, mint képességméréssel, mert az adandó és elfogadandó válaszok meghatározása egyértelműbb. Ugyanígy igaz, hogy objektívabban tudunk mérni zárt végű kérdésekkel, amelyekre csak egy vagy véges számú válasz adható, mint kreativitást igénylő nyílt végű kérdésekkel. Általában is kimondhatjuk, hogy az egyértelműség biztosítása az objektivitás egyik legfontosabb előfeltétele. Mindez nem jelenti azt, hogy nyílt végű, képességeket mérő, sőt esszéisztikus választ igénylő feladatok esetében az objektivitás elérhetetlen, csak éppen nehezebb megvalósítani, és kétségkívül megvannak a határai.
Az érvényesség (validitás) azt jelenti, hogy a teszt azt méri, amit mérni akarunk. Ez nagyon sok esetben nincs így. Egy esszékérdés deklarált célja lehet például annak mérése, hogy a tanuló képes-e egy témát logikusan és összefüggően kifejteni. Ha azonban a javítókulcs alapján csak azt vizsgáljuk, hogy minden szükséges ismeretelemet tartalmaz-e az esszé, és nem pontozzuk a kifejtés logikáját és koherenciáját, akkor ez a tesztkérdés nem érvényes: mást mér valójában, mint ami a deklarált célja. Az érvényességprobléma példánkban persze fordítva is jelentkezhet: esetleg csak a tárgyi tudásra vagyunk kíváncsiak, de a nyelvi megformáltságot is figyelembe vesszük a pontérték meghatározásakor. Egy másik jellegzetes példa az okokra vonatkozó tesztkérdés. “Milyen okokra vezethető vissza a Magyar Sörpárt választási győzelme?” Ez a kérdés politikai problémamegoldást vizsgál, ha korábban órán nem dolgozták fel a kérdést. De ha a füzetben szerepel a válasz pontokba szedve, és a tanulóknak ezt meg kellett tanulni a vizsgára, akkor csak a tárgyi tudás méréséről van szó.
A nem érvényes teszt “őrült beszéd, de van benne rendszer”: mér valamit, csak éppen nem azt, amit mérni akarunk. A teszt hibái rendszert alkotnak. Néha azonban a tesztben olyan hibák vannak, amelyek esetlegesek: ilyenkor a megbízhatósággal (reliabilitással) van baj. A természettudományokban elvileg egyszerűbb a megbízhatóság megállapítása. Ha egy hőmérő szerint a víz egyszer 90 fokon forr, máskor 110 fokon, és semmi okunk nincs annak feltételezésére, hogy a víz forráspontja szeszélyesen ingadozik, akkor az a hőmérő megbízhatatlan. Tesztek esetében ez az analógia nem követhető, mert ha ugyanazzal a tanulócsoporttal ugyanazt a tesztet újra elvégeztetjük, az eredmény a legmegbízhatóbb teszt esetében is eltérő lesz, hiszen a tanulók már az első feladatmegoldáskor tanultak valami újat. (Ez persze – ma már tudjuk – sokszor a természettudományok számára is probléma.) A megbízhatóság mérése bonyolult dolog, a precíz mérők egy teszt megbízhatóságát úgy próbálják meghatározni, hogy a teszt különböző feladatainak (itemeinek) eredményeit hasonlítják össze matematikai statisztikai módszerekkel.
Báthory Zoltán: Tanulók, iskolák – különbségek. Budapest, 1997, OKKER.
Csapó Benő: Tudásszintmérő tesztek. In: Falus Iván (szerk.): Bevezetés a pedagógiai kutatás módszereibe. Budapest, 2000, Műszaki Könyvkiadó, 277-316. o.
Csíkos Csaba – B. Németh Mária: A tesztekkel mérhető tudás. In: Csapó Benő (szerk.): Az iskolai tudás. Budapest, 1998, Osiris, 83–114. o.
Hunyady Györgyné – M. Nádasi Mária: Osztályozás? Szöveges értékelés! Modern pedagógia a gyakorlatban. Dinasztia Kiadó, Budapest, 2004.