top of page

Hvad er chi-square?


Chi-square er en test for, om fordelingen i en gruppe har betydning for fordeling i en anden gruppe.

Det man undersøger er altså kategoriske variables betydning for andre kategoriske variable. Eksempelvis kan man have en variabel, der hedder komplikation ja/nej, og her vil ens population være delt i dem der har komplikationer, og dem der ikke har komplikationer. Samtidig vil ens population typisk også være delt i mænd og kvinder eller behandling A og B eller andre opdelinger. Det man så kan se, er f.eks. hvor mange procent af kvinderne havde komplikationer, og hvor mange % af mændene havde komplikationer, og man spørger således, om kønnet betyder noget for komplikationsfrekvensen. Det kan man teste ved hjælp af en chi-square.

Det kan være, at der var 10% af mændene der havde komplikationer, og 5% af kvinderne der havde komplikationer. Umiddelbart vil man mene, at der er en forskel mellem de 2, men ligesom med alle andre observationer i forskning, er man nødt til at teste, om forskellen også er statistisk signifikant. Hvis man ved en chi-square får et statistisk signifikant resultat, kan man altså konkludere, at der er forskel i komplikationsfrekvensen mellem mænd og kvinder.

Der er en række forudsætninger der skal være opfyldt, for at chi-square kan laves. Den vigtigste forudsætning er, at der er nok observationer i alle kategorier. Som tommelfingerregel skal der være mere end 5 observationer hvert sted. Altså mere end 5 kvinder med komplikationer, mere end 5 kvinder uden, mere end 5 mænd med komplikationer og mere end 5 mænd uden komplikationer. Er forudsætningerne for en chi-square ikke opfyldt, bør man i stedet bruge Fischer’s test som gør præcist det samme, men som korrigerer for, at der er få observationer.

Tolkningen af chi-square testen er relativt simpel, så længe man kun har 2 kategorier for hver variabel, altså mand/kvinde og komplikation ja/nej, men har man flere kategorier bliver tolkningen lidt sværere. Det kan være, at man har en variabel med 3 kategorier, eksempelvis 3 forskellige regioner, hvor man ønsker at undersøge, om der er forskel i komplikationsfrekvenserne.

Såfremt man får en statistisk signifikant p-værdi ved sin chi-square test, kan det være svært at konkludere, hvor forskellen ligger, hvis man eksempelvis havde observeret 10% komplikationer på Sjælland, 8 på Fyn og 15 i Jylland. Så skal man undersøge, hvor er det den statistiske forskel ligger – er det imellem Fyn og Jylland, mellem Sjælland og Jylland eller mellem Fyn og Sjælland. Det kan man gøre ved at regne på konfidensintervaller for andelen eller antallet af patienter med komplikation.

Arkiv
Søg via tags
bottom of page