Hjem » Akut medicin » Om sensitivitet og specificitet

Om sensitivitet og specificitet

af Anders Kaack, d. 11. april 2024. Senest opdateret d. 3. maj 2025

Uden diagnostiske test, ingen klinisk medicin. Klinisk medicin, at behandle syge patienter, beror på evnen til at sandsynliggøre en diagnose. At sandsynliggøre en diagnose kræver viden om 1) den population, man undersøger, og 2) viden om de test, man vil undersøge med.

Sensitivitet og specificitet er to sine qua non måder at beskrive sine diagnostiske test på.

En diagnostisk test kan være både et spørgsmål til anamnesen (fx “hvor svær er din smerte på en skala fra 0 til 10?”), et resultat af en objektiv undersøgelse (fx “bankeømhed i nedre højre kvadrant”) eller resultatet af en paraklinisk undersøgelse (fx “fund af inflammeret appendix på kontrastforstærket CT”).

Til at beskrive værdien af en diagnostisk test, fx hvor god den er til at finde de syge, kan man bruge sensitivitet og specificitet. Det følgende kommer ind på:

  1. En simpel krydstabel til didaktisk støtte
  2. Definition af sensitivitet
  3. Definition af specificitet
  4. Beregner af sensitivitet og specificitet
  5. Eksempler på anvendelse af sensitivitet og specificitet i cancerudredningen
  6. Eksempler på anvendelse af sensitivitet og specificitet i akut medicin
  7. Hvorfor det er nødvendigt at kende prævalens af sin sygdom, når man vil bruge sensitivitet og specificitet i det kliniske arbejde.

En simpel krydstabel

Her er en generisk tabel, som kan være en god hjælp at støtte sig til, når man skal definere sensitivitet og specifictet. Det er en simpel krydstabel med to kategoriske variable: sygdomstilstand (rask/syg) og testresultat (positiv/negativ)

Syg Rask Total
Positiv Sandt positiv (SP) Falsk positive (FP) Alle positive
Negativ Falsk negativ (FN) Sandt negativ (SN) Alle negative
Total Alle syge Alle raske

Man aflæser testresultatet i første kolonne og sygdomstilstanden i første række. En patient, der er rask, men får en positiv test, vil være falsk positiv (FP) og så fremdeles.

Definition af sensitivitet

Sensitivitet betegner en tests evne til at finde de syge i en population af både syge og raske. Det kan man også sige sådan, at sensitivitet er forholdet mellem de sandt positive og alle de syge. Alle de syge udgøres af de sandt positive, dem som testen korrekt finder, og de falsk negative, dem som testen ikke finder. Det kan også udtrykkes sådan her:

Sensitivitet = Sandt positive / (Sandt positive + Falsk negative) = Sandt positive / Faktisk syge

Definition af specificitet

Specificitet betegner en tests evne til at finde de raske i en population af både syge og raske. Det kan man også sige sådan, at specificitet er forholdet mellem de sandt negative og alle de raske. Alle de raske udgøres af de sandt negative og de falsk positive. Det kan også udtrykkes sådan her:

Specificitet = Sandt negative / (Sandt negative + Falsk positive) = Sandt negative / Faktisk raske

Tabel til beregning af sensitivitet og specificitet

Det kan nogle gange være en god hjælp selv at kunne lege med tallene, så herunder er en lille tabel, lavet af ChatGPT med forfatterens egne, men dårlige javascript-rattelser, så brug den til læring og på egen ansvar. Den er forudfyldt med testresultater, og du kan selv indføre og få udregnet sensitivitet og specificitet.

Antal faktisk syge Antal faktisk raske Sum
Antal positive testresultater

267

Antal negative testresultater

233

Sum

45

455


Det er værd at bemærke, at enhver beregning af en test sensitivitet og specifictet forudsætter en guldstandard, som man kan holde sin test op imod. Man skal have en måde at diskriminere mellem de faktisk syge og de faktisk raske.

Eksempel med beregning af sensitivitet og specificitet i cancerudredningen

Af uransagelige årsager er en cancerudredning hyppigt brugt til illustration af beregning af sensitivitet og specificitet. Så nu gentager jeg øvelsen på et hypotetisk eksempel med hypotetiske tal: Hepatocellulært carcinom. Lad os sige, at diagnosen HCC kan stilles definitivt med en biopsi og efter patologisk undersøgelse. Efter farvning og mikroskopering kan man med 100 % sikkerhed skelne de faktisk syge fra de faktisk raske (vi ignorerer sampling errors og analyseusikkerheder hos patologen). Vi tester 500 konsekutive patienter og finder HCC hos 100 af disse. Samtidig vælger vi at lave en test, nemlig kontrastforstærket CT-skanning, fordi vi ved at HCC-elementer har et karakteristisk mønster med tidlig kontrastopladning og tidlig kontrastudvaskning. Vi tester alle 500 patienter fra tidligere og finder sådan et mønster hos 95 af de patienter, som patologisk set har HCC. Det vil sige, at 5 patienter har en negativ test, men faktisk er syge. Vi finder imidlertid også mønstret hos 2 patienter, som vi ved ikke har HCC. Det vil sige, at 398 patienter har en negativ test og faktisk er raske. Det kan plottes ind i en tabel som den ovenstående:
Antal faktisk syge Antal faktisk raske Sum
Antal positive testresultater 95 2 97
Antal negative testresultater 5 398 403
Sum 100 400
Det giver en sensitivitet af kontrastforstærket CT-skanning på 95 % og en specificitet på 99,5 %. En test med så god sensitivitets og specificitetsværdier er helt fantastisk.

Eksempel med beregning af sensitivitet og specificitet i akut medicin

Sensitivitet og specificitet er ikke kun anvendeligt i cancerudredningen, selvom lærebøger i epidemiologi og biostatistik nogle gange kan give det indtryk. Lad os kigge på patienter med akut hjertesvigt defineret som nyopstået fald i ejection fraction som afgjort ved ekkokardiografi. Vi undersøger 500 patienter i akutmodtagelsen med ekkokardiografi og finder akut hjertesvigt hos 45 af disse, mens 455 ikke har akut hjertesvigt. Vi ignorerer igen den virkelige verden (med fx diagnostisk setup, rekruttering, patientflow, mv.), eksemplet er helt tænkt og hypotetisk Samtidig vælger vi at lave en test, nemlig at spørge patienterne om de har åndenød. Vi tester alle 500 patienter med det samme spørgsmål. Hos de 45 patienter med hjertesvigt svarer 37, at de har åndenød. Omvendt svarer 8, at de ikke har åndenød. Blandt de 455 uden hjertesvigt svarer 230, at de har åndenød, og omvendt svarer 225, at de ikke har. Det kan plottes ind i en tabel som den ovenstående:
Antal faktisk syge Antal faktisk raske Sum
Antal positive testresultater 37 230 267
Antal negative testresultater 8 225 233
Sum 100 400
Det giver en sensitivitet af spørgsmålet “Har du åndenød?” på 82,2 % og en specificitet på pauvre 49,5 %. Spørgsmålet er altså godt til at finde patienterne med, men finder desværre også en masse patienter med åndenød, men uden hjertesvigt.

Sensitivitet og specificitet af en test for en sygdom er ligegyldig, hvis du ikke kender sygdomsprævalensen

For rent faktisk at kunne bruge en tests sensitivitet og specificitet i den kliniske hverdag, bliver du nødt til at vide noget om, hvor stor sandsynligheden for en given tilstand er.

Et tænkt eksempel med tænkte værdier: 

Du er aspirerende nefrolog og vil gerne finde ud af, om en patient A i din akutmodtagelse har nefrotisk syndrom. Du ved, at fund af protein i urinen sandsynliggør nefrotisk syndrom, og som det allerførste vælger du derfor at teste for det. Du ved, at sensitiviteten denne test for proteinuri er 96 %, men specificiteten er kun 30 %. Det vil sige, at langt de fleste patienter med nefrotisk syndrom har proteinuri på urinstix (sensitiviteten er god), men der er mange andre årsager til proteinuri på urinstix (specificiteten er dårlig).  

Du finder proteinuri! Din test er positiv.

Du er en meget entusiatisk nefrologaspirant og må desværre sige, at prævalensen af nefrotisk syndrom i din akutmodtagelse meget lav. Faktisk modtog i sidste år kun 1 patient med nefrotisk syndrom for hver 1000 patient, der kom ind i modtagelsen. Du har ikke rigtig gjort noget for at sandsynliggøre, at netop denne patient A skulle være den ene ud af de 1000.

Det er et problem, for selvom din test er positiv, er den positive prædiktive værdi ikke særligt høj. Du finder en handy beregner og finder hurtigt ud af, at den positive prædiktive værdi kun er 1,4 %. Diagnostisk set er du ingen vegne kommet! Du kunne principielt lige så godt have ladet være med at stixe urinen.

Du møder nu en anden patient B og klog af skade lader du være med at stixe urinen up front. Du taler i stedet med patienten og finder ud af, at patienten har været træt og forkvalmet den seneste tid. Patienten har også lagt mærke til, at urinen skummer, og at benene er blevet hævet. Du undersøger patienten og finder i tillæg til at benene er hævede også hævelse i øjenomgivelserne. Laboranten har allerede været fordi, og i biokemimodulet ser du, at patienten har hypoalbuminæmi.

Du stixer urinen igen, og du finder proteinuri. Din test er positiv.

Nu er du langt bedre stillet, for din a priori sandsynlighed for, at netop denne patient er den ene patient ud af de 1000 er meget høj. Din kliniske mistanke er faktisk så stærk, at du tænker, at patienten har nefrotisk syndrom indtil andet er bevist, og du mener, at sandsynligheden er 75 %. Du bruger igen din handy beregner, og finder nu en positiv prædiktiv værdi på 81 %. 

Du flytter patienten til nefrologisk afdeling, og her vælger I at kvantificere mængden af protein i opsamlet døgnurin og finder, at der er mere end 3,5 g (endnu et positivt testresultat!). Det er et testresultat med en meget højere specificitet, for ikke mange tilstande kan producere den mængde protein i urinen. Sensitiviteten er faktisk 98 %, men specificiteten er nu helt oppe på 80 %.

Det giver en positiv prædiktiv værdi på 94 %.

Med andre ord: En tests sensitivitet og specificitet er fuldstændigt ligegyldigt, hvis du ikke kender prævalensen af den tilstand, som du tester for. Det har jeg skrevet mere om her.

Kilder

Altman DG, Bland JM. Diagnostic tests. 1: Sensitivity and specificity. BMJ. 1994 Jun 11;308(6943):1552. doi: 10.1136/bmj.308.6943.1552. PMID: 8019315; PMCID: PMC2540489.