Grundlæggende statistiske begreber

Hjem » Epidemiologi og statistik » Grundlæggende statistiske begreber

Grundlæggende statistiske begreber

af Anders Kaack, d. 27. februar 2024. Senest opdateret d. 3. maj 2025

Her er en ofte hørt formulering: En af den kliniske medicins hovedopgaver er at stille en korrekt diagnose. Det er ikke korrekt! Opgaven er at sandsynliggøre en diagnose. Medicin er biologi, det er ikke newtoniansk mekanik, og er derfor underlagt sandsynlighedernes åg.

Diagnostisk tankegang er altså afhængig af sandsynligheder og derfor af statistik. Det følgende er en kort gennemgang af udvalgte centrale statistiske begreber, som enhver kliniker hver eneste dag på hver eneste arbejdsplads i hele landet – og i alle andre lande. Har man lyst til at læse undertegnedes videre, lommefilosofiske skriblerier om statistik og medicin, er der med kyndig hånd spredt links ud over hele teksten.

Her er en indholdsfortegnelse:

Hvad er diagnostisk tankegang?
Hvad er probabilistisk og deterministisk tankegang?
Hvad er prævalens?
Hvad er en diagnostisk test?
Hvad er sensitivitet?
Hvad er specificitet?
Hvad er prædiktive værdier?

Hvad er diagnostisk tankegang?

At stille en diagnose handler om at sandsynliggøre, at der foregår en patologisk proces i en patient. For at gøre det, er man nødt til at have en omfattende viden om den normale anatomi og fysiologi, og man er nødt til at have en idé om, hvor hyppig forskellige patologiske tilstande er.

Spørgsmålet man altid stiller sig selv er: “Er det mest sandsynligt, at denne patient er syg, eller er det ikke?”

For at komme det spørgsmål nærmere, indebærer al diagnostik elementer af følgende:

1) Hvad synes patienten, der er galt? Eller tilsvarende, hvis patienten af den ene eller anden grund ikke kan svare på spørgsmål.

2) Hvad er baggrundssandsynligheden for de mest relevante sygdomme?

3) Hvordan kan patienten uddybe sin sygehistorie?

4) Hvad frembyder patienten med objektivt?

5) Hvilke diagnostiske test er relevante at foretage – hvis nogen?

Punkt 1-3 ovenfor er vores forsøg på at selektere patienten ind i bestemte populationer. Det kan for eksempel være, at vi vurderer, at patienten mest sandsynligt fejler noget indenfor reumatologien, eller neurologien eller har et abdominalkirurgisk problem. Ved hjælp af anamnesen kan man selektere patienten ind i forskellige patientpopulationer og derved ændre ved sandsynligheden for, at patienten fejler noget.

For eksempel: En patient møder i almen praksis og fortæller at have ondt i storetåen. Allerede her er der flere sandsynlige muligheder: Overbelastning, traume, reumatologi, infektion. Det er meget usandsynligt, at patienten med ondt i tåen skulle fejle noget abdominalkirurgisk. Patienten uddyber anamnesen og kan fortælle, at det kom relativt pludseligt, uden feber og uden forudgående traume, gør vanvittigt ondt, og at tåen er rød, øm og hævet. Sandsynligheden for, at patienten tilhører den reumatologiske patientpopulation er nu meget høj, og det gør, at vores videre diagnostiske test er meget mere anvendelige.

Diagnostik og diagnostisk tankegang er ikke andet end en test på en mere eller mindre selekteret patientpopulation.

Hvad er probabilistisk og deterministisk tankegang?

Diagnostik handler om sandsynligheder eller probabilismer. Det vil sige, at der involveret i diagnostik af sygdom definitorisk er indlejret et element af tilfældigheder. Alle vores spørgsmål har lidt tilfældig variation i svarene, alle vores objektive undersøgelser har et element af tilfældighed, og alle parakliniske undersøgelser er stokastisk fordelte omkring en sand værdi. Det kan man ganske groft sætte i modsætning til deterministisk tankegang, hvor man i stedet for at spørge sig selv:

Er det mest sandsynligt at denne patient er syg eller rask?

Spørger sig selv

Er denne patient syg eller rask?

Det vil sige fortolker sine undersøgelsesresultater sådan, at de giver et definitivt, deterministisk svar. Eller med andre ord, at man i sin diagnostiske model har nogle variable, som man udfylder med sikre inputs og på den baggrund får man et sikkert output.

Hvad er prævalens og a priori-sandsynligheder?

Prævalens angiver en tilstands forekomst i en population. Det kan også kaldes a priori-sandsynlighed, fordi det betegner sandsynligheden for en tilstand før man fx har testet for en sygdom. Af samme grund kan man møde prævalens som præ-test-sandsynligheder.

Prævalenser er kontekstafhængige forstået på den måde, at de afhænger helt af, hvilke populationer, man kigger på. Helt evident er prævalensen af multipel sklerose helt anderledes i Skandinavien end i for eksempel Sydeuropa. Men prævalensen kan også variere med den kliniske kontekst. Prævalensen af multipel sklerose blandt populationen på venteværelset på neurologisk afdeling er meget højere end prævalensen af multipel sklerose blandt populationen af indbyggere i det østlige Jylland.

Man kan også illustrere det med disse fire hypotetiske eksempler:

Prævalensen af akut myokardioinfarkt hos alle patienter med brystsmerter i venteværelset i almen praksis en mandag morgen kl 9:00 er 1 %.
Prævalensen af akut myokardioinfarkt hos alle patienter med brystsmerter i akutmodtagelsen på et regionssygehus mandag morgen kl 9:00 er 5 %.
Prævalensen af akut myokardioinfarkt hos alle patienter med brystsmerter indlagt på hjerteafsnit mandag morgen kl 9:00 er 30 %.
Prævalensen af akut myokardioinfarkt hos alle patienter med brystsmerter i ambulancen på vej mod kardiologisk laboratorium mandag morgen kl 9:00 er 90 %. (Og her har jeg snydt, fordi de har fået taget et EKG og troponiner.)

Hvad er en diagnostisk test?

En diagnostisk test er et spørgsmål, en objektiv undersøgelse eller en paraklinisk test, som man bruger for at selektere patienter ind i forskellige grupper.

Med en god anamnese, der også er en form for diagnostisk test, kan man sandsynliggøre, at patienten tilhører en bestemt patientpopulation. Med forskellige objektive undersøgelser kan man yderligere sandsynliggøre det samme. Når man med kombinationen af subjektivt og objektivt har sandsynliggjort en bestemt diagnose, kan man ved hjælp af parakliniske test øge sandsynligheden for diagnosen.

Et eksempel kunne for eksempel være diagnosen akut pankreatitis, hvis sandsynlighed beror på:

Øvre abdominale smerter (anamnestiske og objektive test)
Forhøjet P-amylase (en biokemisk test)
CT-fund forenelig med pancreatit (en billeddiagnostisk test)

Hvad er sensitivitet?

En diagnostisk test kan beskrives med to centrale begreber: Sensitivitet og specificitet.

Sensitivitet er andelen af sande positive testsvar i forhold til antallet af syge. Det kan man også formulere sådan, at det er andelen af sande positive testsvar i forhold til, hvor mange faktiske positive testsvar der burde være, hvis testen var perfekt. Man kan også fomulere det sådan, at det er forholdet mellem sande positive og summen af sande positive og falske negative.

Sensitivitet = ^{Sande positive}⁄_{(Sande positive + falske negative)}

Her er to eksempler på, hvordan man kan bruge sensitivitet til at beskrive to forskellige diagnostiske test:

Spørgsmålet “Har du brystsmerter?” er en diagnostisk test, der kan beskrives med en sensitivitet i forhold til at stille diagnosen akut myokardieinfarkt. Hvis man spørger 100 patienter, som man efter grundige undersøgelser har diagnosteret med AMI, vil 90 af dem svare, at de har brystsmerter (tallene er grebet ud af den blå luft). Det giver en sensitivitet på 90 %.
En ekkokardiografi kan diagnosticere hjertesvigt med 100 % sandsynlighed og finder hjertesvigt hos en population på 100 patienter. Man beslutter sig samtidig for at lungestetoskopere alle patienterne og finder, at 46 af dem har krepitationer (her er tallene er ikke grebet ud af den blå luft), mens 54 ikke har. Sensitiviteten er 46 / (46 + 54) = 0,46.

Her er mere om sensitivitet og specificitet, og jeg har også lavet en lille beregner, så man selv kan lege med forskellige tal. Beregneren kommer med flere regneeksempler.

Hvad er specificitet?

Det andet centrale begreb, som man kan bruge til at beskrive en diagnostisk test med er specificitet.

Specificiteten er andelen af sandt negative testsvar i forhold til antallet af syge. Det kan man også formulere sådan, at det er andelen af sande negative svar i forhold til, hvor mange negative svar, der burde være, hvis testen var perfekt. Man kan også kalde det forholdet mellem sande negative og summen af sande negative og falske positive.

Specificitet = ^{Sande negative}⁄_{(Sande negative + falske positive)}

Eksempel: En ekkokardiografi er guldstandarden for diagnostik af hjertesvigt, og i en større population af patienter finder man 100 patienter, der ikke har hjertesvigt. Man vil på denne store population af patienter lungestetoskopere dem for at finde ud af, om lungestetoskopi er en god diagnostisk test for hjertesvigt. Hos disse 100 raske patienter finder man kun krepitationer hos 10. Specificiteten af lungestetoskopi er 90 / (90 + 10) = 90 %.

Hvorfor er specificiteten anvendelig? Hvis en test er 100 % specifik og kun har sandt negative og ingen falske positive, så kan man ved et positivt testresultat med sikkerhed kunne lave rule in af sygdom.

Hvad er en prædiktiv værdi?

En tests sensitivitet og specificitet er grundlæggende rare at kende, men de angår kun den diagnostiske test. Hvis man ikke kender sin population og sygdomsprævalensen, er man ikke særligt godt stillet.

Den positive prædiktive værdi er forholdet mellem sande positive og summen af sande positive og falske positive og siger altså, hvad sandsynligheden er for sygdom er i en given population givet et positivt testresultat.

Positiv prædiktiv værdi = ^{Sande positive i en population}⁄_{(Sande positive i en population + falske positive i en population)}

Det kan man cf. Bayes teorem også skrive sådan her:

Positiv prædiktiv værdi = ^{Sensitivitet * prævalens}⁄_{(Sensitivitet * prævalens + (1 – specificitet) * (1 – prævalens))}

Med positive prædiktive værdier kan man oversætte et testresultat i en given population til en faktisk sandsynlighed for, at et positivt eller negativt testresultat faktisk repræsenterer henholdsvis sygdom eller ikke-sygdom. Det kan man ikke gøre på baggrund af viden om sensitivitet og specificitet alene.

To eksempler:

En virkelig god test for en sygdom har en sensitivitet på 98 % og en specificitet på 97 %. Altså, den er virkelig god. En kliniker vælger at bruge testen for at undersøge for sygdommen og får et positivt resultat, men i en population hvor kun 1 ud af 1000 har sygdommen. Men fordi testen fanger en stor del falsk positive og faktisk ikke fanger alle de faktisk syge, er den positive prædiktive værdi kun knap 25 %.
Den samme test med samme positive resultat anvendt i en population med en sygdomsprævalens på 40 % har en positiv prædiktiv værdi på knap 96 %.

En test med en fastlagt sensitivitet og specificitet opfører sig altså helt forskelligt afhængigt af, hvad prævalensen af en sygdom er.

Jeg har lavet en lille handy beregner til både positiv prædiktiv værdi og negativ prædiktiv værdi, som man frit kan bruge.

Kilder

Ioannidis JP. Why most published research findings are false. PLoS Med. 2005 Aug;2(8):e124. doi: 10.1371/journal.pmed.0020124. Epub 2005 Aug 30. Erratum in: PLoS Med. 2022 Aug 25;19(8):e1004085. PMID: 16060722; PMCID: PMC1182327.