Hjem » Epidemiologi og statistik » Confounding

Confounding

af Anders Kaack, d. 28. april 2024. Senest opdateret d. 3. maj 2025

Confounding er et for danskere (eller alle andre med et germansk sprog som modersmål) fuldstændigt forvirrende ord, der komplet mangler en dansk ækvivalent. Heldigvis betyder ordet i sig selv forvirrende eller overraskende, så på den måde kan man blive confounded over ordet confounding.

Hvad er confounding? Og hvorfor er det et problem?

Confounding er det tilfælde, at en samvariation imellem to variable (for eksempel eksponering og outcome) skyldes en bagvedliggende variabel. Hvis to variable korrelerer, kunne man forledes til at tro, at de indgik i en kausal sammenhæng. Hvis korrelationen i virkeligheden skyldes en bagvedliggende variabel, så er der ikke tale om kausalitet.

Så confounding er et problem, fordi det indgår i kernen af diktummet: “Correlation does not mean causation.”

Correlation does not imply causation!

xkcd.com, Munroe

For at en variabel er en confounder, skal den opfylde tre kriterier:

Den skal være:

  1. Associeret med eksponeringen
  2. Associeret med outcome
  3. Ikke være forårsaget af eksponeringen, hvilket vil sige, at den skal gå forud i tid for både eksponering og outcome.

.

Det vil sige, at en confoundere skal variere med eksponering og outcome og ikke må være en intermediær variabel imellem eksponering og outcome.

Man kan møde formuleringen, at en sammenhæng er spuriøs, det vil sige falsk. Med det mener man, at en sammenhæng fandtes, men idet man kontrollerede for confounding, forsvandt sammenhængen. Spuriøsitet er altså resultatet af, at confoundende variable har været på spil.

Illustration af confounding

Confounding kan man illustrere med en simpel tegning som herunder:

Illustration af confounding.

Man kan se, at eksponering og outcome samvarierer (illustreret med den stiplede, dobbeltrettede pil), og at det skyldes, at der findes en bagvedliggende variabel (confounderen), der samvarierer med både eksponering og outcome.

Eksempel på confounding

Man kan også illustrere confounding med hypotetiske data plottet i et koordinatsystem.

Illustration af confounding ved hjælp af data plottet i et simpelt koordinatsystem.

Illustrationen er et simpelt koordinatsystem med eksponering ud af X-aksen og outcome op ad Y-aksen. Hvis man ser de røde og sorte prikker samlet, kan man tilnærmelsesvist tegne den stiplede sorte linje igennem prikkerne. Det er en relativt stærk sammenhæng, omend der er en del spredning.

Imidlertid viser data at være påvirket af en variabel, som man logisk set ved kommer før både eksponering og outcome (eksempler er legio og helt afhængige af forskningsspørgsmålet: køn, rygning under graviditeten, tidligere hospitalisering for anden ikke-relateret sygdom, og så videre, og så videre). Data dækker over både de røde prikker og de sorte prikker, og når man laver to regressionslinjer igennem de to, nu separate, dataskyer, kan vi se, at sammenhængen nærmest forsvinder (og vel er ikke-signifikant forskellige fra en hældning på 0). Der er altså tale om confounding.

Confounding og intermediære variable

Kriterium 3 i definitionen af confounding sagde, at confounderen ikke måtte være forårsaget af eksponeringen. Hvis confounderen er forårsaget af eksponeringen, er der ikke tale om en confounder, men en intermediær variabel. Det kan man illustrere sådan her:

Illustration af en intermediær variabel, der er forårsaget af eksponeringen.

Det vil sige, at confounderen varierer med både eksponering og outcome, men indgår i (den formodede) kausalkæde, der leder fra eksponering til outcome. Den er derfor slet ikke er en confounder. 

Kilder

Jager KJ, Zoccali C, Macleod A, Dekker FW. Confounding: what it is and how to deal with it. Kidney Int. 2008 Feb;73(3):256-60. doi: 10.1038/sj.ki.5002650. Epub 2007 Oct 31. PMID: 17978811.