De 4 forskjellene mellom pålitelighet og gyldighet (i vitenskapen)

April 20, 2024

Siden de på tvers av språk har de svært like betydninger, er det lett å forvirre vilkårene for pålitelighet og gyldighet når vi snakker om vitenskap og spesielt av psykometri.

Med denne teksten har vi til hensikt å belyse store forskjeller mellom pålitelighet og gyldighet . Forhåpentligvis finner du det nyttig å klargjøre denne vanlige tvilen.

Relatert artikkel: "Psychometrics: studere menneskets sinn gjennom data"

Hva er pålitelighet?

I psykometri, begrepet "pålitelighet" refererer til nøyaktigheten av et instrument ; Spesifikt informerer pålitelighetskoeffisientene om konsistensen og stabiliteten til tiltakene som er tatt med dette verktøyet.

Jo større påliteligheten av et instrument, desto lavere er antallet tilfeldige og uforutsigbare feil som vil vises når du bruker den til å måle bestemte attributter. Pålitelighet utelukker forutsigbare feil, det vil si de som er underlagt eksperimentell kontroll.

I henhold til den klassiske testteorien er påliteligheten andelen av variansen som forklares av de sanne resultatene. Dermed vil den direkte poengsummen i en prøve utgjør summen av tilfeldig feil og den sanne poengsummen.

De to hovedkomponentene i pålitelighet de er midlertidig stabilitet og intern konsistens . Det første konseptet indikerer at resultatene endres lite når de måles ved forskjellige anledninger, mens den interne konsistensen refererer til i hvilken grad de elementene som utgjør prøven, måler samme psykologiske konstruksjon.

En høy pålitelighetskoeffisient indikerer derfor at resultatene på en prøve svinger lite internt og som en funksjon av tid og, i sammendrag, at instrumentet er fravær av målefeil .

Kanskje du er interessert: "Typer psykologiske tester: deres funksjoner og egenskaper"

Definisjon av gyldighet

Når vi snakker om gyldighet, refererer vi til om testen korrekt måler konstruksjonen den har til hensikt å måle. Dette konseptet er definert som forholdet mellom poenget oppnådd i en test og en annen relatert tiltak ; graden av lineær korrelasjon mellom begge elementene bestemmer validitetskoeffisienten.

Også i vitenskapelig forskning indikerer en høy validitet i hvilken grad resultatene oppnådd med et gitt instrument eller i en studie kan generaliseres.

Det finnes ulike typer gyldighet, som avhenger av måten det er beregnet på. Dette gjør det til et begrep med svært forskjellige betydninger. I utgangspunktet kan vi skille mellom innholdsvaliditet, kriterium (eller empirisk) gyldighet, og konstruere gyldighet .

Innholdsgyldighet definerer i hvilken grad gjenstandene i en psykometrisk test er et representativt utvalg av elementene som utgjør konstruksjonen som skal evalueres. Instrumentet må inkludere alle grunnleggende aspekter av konstruksjonen; For eksempel, hvis vi vil gjøre en tilstrekkelig test for å måle depresjon, må vi nødvendigvis inkludere elementer som vurderer humør og redusere glede.

Kriteriegyldighet måler instrumentets evne til å forutsi aspekter relatert til funksjonen eller interessepunktet. Endelig er konstruktivgyldigheten ment avgjøre om testen måler hva den har til hensikt å måle , for eksempel fra konvergensen med poengene oppnådd i lignende tester.

Forskjeller mellom pålitelighet og gyldighet

Selv om disse to psykometriske egenskapene er nært beslektet, er sannheten at de refererer til klart differensierte aspekter. La oss se hva disse forskjellene er .

1. Målet med analysen

Pålitelighet er en egenskap for instrumentet, i den forstand at det måler egenskapene til elementene som består av det. På den annen side refererer gyldigheten ikke nøyaktig til instrumentet, men til generaliseringene som er laget av resultatene hentet gjennom det.

2. Opplysningene de oppgir

Selv om det er en noe forenklet måte å sette på, er det generelt sagt at validitet indikerer at et psykometrisk verktøy faktisk måler konstruksjonen den skal måle, mens påliteligheten refererer til om det måler det riktig, uten feil.

3. Måten de beregnes på

Tre prosedyrer er fundamentalt brukt til å måle påliteligheten: Metoden for de to halvdelene, den ene av parallelle former og test-retest . Den mest brukte er prosedyren til de to halvdelene, der artiklene er delt inn i to grupper når testen er besvart; så analyseres korrelasjonen mellom de to halvdelene.

Metoden for parallelle eller alternative former består i å skape to ekvivalente tester for å måle i hvilken grad de korrelerer elementene mellom dem. Test-retest er rett og slett basert på å passere testen to ganger, under forhold som er like like som mulig.Begge prosedyrene kan kombineres, noe som gir anledning til test-retest med parallelle former, som består i å forlate et tidsintervall mellom den første testformen og den andre.

For sin del, gyldigheten Det beregnes på forskjellige måter avhengig av typen , men generelt er alle metoder basert på sammenligningen mellom poengsummen i objektivprøven og andre data for de samme fagene i forhold til lignende trekk; Målet er at testen kan fungere som en prediktor av egenskapen.

Blant metodene som brukes til å evaluere gyldigheten, finner vi den faktorielle analysen og teknikken til multi-metoden-multi-trait matriser. Også innholdsvaliditet bestemmes ofte av rasjonelle, ikke-statistiske analyser; for eksempel inkluderer den tilsynelatende gyldigheten, som refererer til den subjektive dommen av eksperter på testens gyldighet.

4. Forholdet mellom begge konseptene

Påliteligheten til et psykometrisk instrument påvirker dens gyldighet: Jo mer pålitelig det er, jo større er dets gyldighet . Derfor er koeffisientene for et verktøys gyldighet alltid lavere enn de som er pålitelige, og gyldigheten indikerer indirekte oss om pålitelighet.