I forskernes verktøykasse finner vi Bradford Hill-kriteriene

På 1950-tallet begynte funn fra observasjonsstudier å antyde at tobakksrøyking var forbundet med økt risiko for lungekreft, samt andre sykdommer. En såkalt korrelasjon eller assosiasjon. Spørsmålet den gang var: Er dette kausalt? Fører tobakksrøyking til lungekreft? Vi kan se for oss at svaret på det spørsmålet kunne vært nei. Tross alt er det en korrelasjon mellom askebeger og lungekreft, men vi veit at askebeger ikke fører til lungekreft. Det er en korrelasjon mellom hvem som eier askebeger og de som får askebeger, men askebeger er ikke kausalt for lungekreft.

Kausalitet er kanskje det mest sentrale temaet innen epidemiologi (populasjonsforskning) og forskning generelt. Det er viktig å ha en god forståelse for kausalitet (årsakssammenheng) og være spesifikk på hvilken type kausalitet man mener når man hevder at et kausalt forhold er sannsynliggjort. Et betimelig spørsmål er jo da: Hvordan kan vi med en rimelig stor grad av sikkerhet si at A fører til B?

Vanlig praksis for å sjekke om noe virkelig er kausalt er å utføre en randomisert, kontrollert studie (Randomized, Controlled Trial, RCT). Du deler gruppene inn i to, en intervensjonsgruppe og en kontrollgruppe. Deretter blir den ene gruppen (intervensjonsgruppen) utsatt for hva enn du vil teste (i dette tilfellet tobakk), mens den andre gruppen (kontrollgruppen) ikke utsettes for dette. En slik studie lot seg åpenbart ikke gjennomføre av etiske og praktiske hensyn.

Tobakksindustrien utnyttet denne usikkerheten og sådde tvil i befolkninga om at røyking faktisk førte til lungekreft. Du kan lese mer om dette i boka «Doubt Is Their Product”. For så vidt er poenget de kom med teknisk sett korrekt: Korrelasjon er ikke lik kausalitet. Derfor er det viktig å være forsiktig med å anta kausalitet basert på kun korrelasjon.

Den britiske epidemiologen, Austin Bradford Hill, publiserte så i 1965 et sett med ni faktorer eller kriterier som ble brukt til å styrke argumentet om at det faktisk var en virkelig eller reell kausalitet mellom røyking og lungekreft. Dette er senere blitt kjent som Bradford Hills kriterier eller Hill-kriteriene.

Disse kriteriene blir også brukt til å avklare hvorvidt andre forhold er kausale. For eksempel mellom alkoholforbruk og leversykdom, soling og hudkreft eller mettet fett og hjertesykdom. Vi har, i likhet med tobakk og lungekreft, funnet ut at det er en reell kausal sammenheng mellom disse ikke gjennom kliniske studier på mennesker, men gjennom observasjonsstudier.

Hill-kriteriene er ikke ment og skal ikke være en streng matematisk formel. Det er ingen garanti for at å oppfylle flere eller til og med alle ni kriteriene avdekker faktisk kausalitet. Absolutt sikkerhet er et sjeldent syn i vitenskapen. Hill-kriteriene er heller ment som veiledning for å hjelpe forskere med å analytisk bedømme om det er en overveiende sannsynlig kausal sammenheng mellom to variabler basert på tilgjengelige data. En slags smørbrødliste som sannsynliggjør en kausalitet jo flere du huker av på, men som ikke utelukker at det ikke må være tilfellet.

Når denne prosessen eller analysen gjøres, og man konkluderer med at et forhold er kausalt, heter det kausal inferens eller årsaksinferens. Kausal inferens er med andre ord selve prosessen eller resonnementet som gjøres når man slutter at et forhold er kausalt, og er således distinkt fra slutningen som gjøres. Det betyr at man kan utfordre eller være uenig i måten den kausale inferensen er blitt gjort på, uten å være uenig i at det fins en kausalitet mellom to forhold, eller vica versa.

Hva er Bradford Hills kriterier?

Hills kriterier er på toppen av alle de andre viktige kravene og metodene i vitenskapen. Det kommer som et tillegg. For eksempel replikasjon, altså at studier skal gjentas med samme utfall, gjelder fremdeles. Evidenspyramiden likeså, altså at visse studiedesign er mer troverdige enn andre.

Induksjon- og deduktiv logikk er også helt sentralt for vitenskapen. Du vil legge merke til at noen av kriteriene er ekskluderende (bruker eksklusjonslogikk – en type deduksjon – for å utelukke hypoteser), mens andre er inkluderende (bruker induksjonslogikk for å sannsynliggjøre hypoteser).

De ni kriteriene er som følger:

1. Temporalitet (rekkefølgen)

Kommer eksponeringen før utfallet? Hvis Y, har da X skjedd? Dette er et ubestridelig og derfor kanskje det viktigste kriteriet å sjekke av på. Kriteriet må sjekkes før vi med rette kan si at et kausalt forhold eksisterer.

Det påståtte kausale forholdet A må altså skje før B. Et viktig forholdbehold er imidlertid at det ikke føler at en omvendt rekkefølge, altså at B skjedde før A, er et bevis mot at A forårsaket B. Observasjoner der A følger etter B viser bare at A ikke forårsaket B i disse tilfellene. For eksempel kan det tenkes at lungekreft har flere årsaker enn røyking. Hvis man får lungekreft og så begynner å røyke, betyr det ikke at røyking ikke forårsaker lungekreft. Årsaken vi leiter etter kommer ikke alltid før selve utfallet.

Dette er et absolutt eksklusjonskriterium, altså et absolutt ekskluderende kriterium. Vi utelukker muligheter, vi muliggjør dem ikke.

2. Dose-respons-kurve

Dersom eksponeringen øker, gir dette større sjanse for utfallet? Hvis røyking forårsaker lungekreft, er det rimelig å anta at økt eksponering for røyk også fører til økt lungekreft. For å finne ut av om dette stemmer, kan man for eksempel sammenligne noen som røyker lite med noen som røyker mye, og se om de som røyker mye i større grad har lungekreft enn de som røyker lite.

En viktig nyanse er at man ofte kan ha både en gulveffekt og en takeffekt. Hvis man ser på studier som har sammenlignet de som ikke røyker med de som kun røyker av og til på fest, kan det hende man ikke finner forskjell i forekomst av lungekreft. Eksponeringen er for liten. Likeledes kan man se på studier som sammenligner de som røyker veldig mye med de som røyker ekstremt mye, og finne at det ikke er forskjell i forekomst av lungekreft mellom gruppene. Dette var triks tobakksindustrien brukte for å påstå at røyking ikke førte til lungekreft – de sammenlignet grupper med for små forskjeller mellom seg.

For å avdekke dose-respons-forholdet, er man nødt til sammenligne grupper eller individer som i tilstrekkelig grad eksponeres for ulik mengde, enten det gjelder røyk, sol, metta fett eller annet.

Dette er et inklusjonskriterium, altså et inkluderende kriterium.

3. Korrelasjonskoeffisient

Hva er styrken på korrelasjonen? En sterk korrelasjon tyder i større grad på kausalitet enn en svak korrelasjon. Svake korrelasjoner kan man ofte forklare bort med uoppdagede konfundere (les: forstyrrende faktorer) og andre feilkilder. Hvis korrelasjonen er svak og man mener det eksisterer kausalitet, er dette i så fall nødt til å forklares på et vis. Hva er de andre forholdene?

Selv om en sterk korrelasjon ikke beviser kausalitet, utelukker en sterk korrelasjon muligheten for at dette i betydelig grad skyldes konfundere eller andre feilkilder.

Dette er et inklusjonskriterium, altså et inkluderende kriterium.

4. Koherens

Er funnet i konflikt med eksisterende kunnskap? Koherens innebærer at et kausalt forhold ikke er i strid med det som nå er kjent, den kunnskapen vi allerede besitter. Hvis tilstedeværelsen av kunnskap motstrider et påstått kausalt forhold, er dette altså et argument mot et faktisk kausalt forhold. Imidlertid er det lurt å ha i bakhodet at den motstridende kunnskapen tross alt kan være feilaktig.

Her understreker Hill også at fravær av kunnskap som peker mot et kausalt forhold, i motsetning til motstridende kunnskap, ikke bør tas som bevis mot et påstått kausalt forhold. Sagt litt annerledes: Mangelfulle bevis er ikke et bevis på manglende bevis..

Dette er et eksklusjonskriterium, altså et ekskluderende kriterium. Vi utelukker muligheter, vi muliggjør dem ikke.

5. Reversibilitet

Hva skjer om vi fjerner det vi ønsker å undersøke om er kausalt? La oss si at vi vil teste om røyk er kausalt for lungekreft. Hvis eksponeringen blir fjernet, forventer vi at risikoen for sykdom også bli borte, eller i alle fall reduseres. Dersom dette skjer, kan vi være mer sikre på at forholdet er kausalt. Om det derimot ikke skulle skje, som tross alt er mulig, er vi nødt til å forklare hvorfor det ikke skjedde.

Dette er et eksklusjonskriterium, altså et ekskluderende kriterium. Vi utelukker muligheter, vi muliggjør dem ikke.

6. Konsistenthet

Kommer studier gang på gang frem til en korrelasjon innad i grupper delt inn etter ulike karakteristikker eller under ulike omstendigheter? Ser vi gjentatte ganger det samme utfallet innad i forskjellige grupper? Dette kan man sjekke ved å gjøre en såkalt subgruppeanalyse: Dersom resultatene er i flere subgrupper/populasjoner (f.eks. delt inn i kjønn, alder, sosioøkonomisk status, BMI, geografi, etnisitet etc.), styrker dette graden vår av sikkerhet for at et forhold er kausalt. For eksempel ser vi en korrelasjon mellom røyking og lungekreft uavhengig av sosioøkonomiske status. Hvis man derimot ikke hadde gjort dette, antyder det til at sosioøkonomisk status har mer å gjøre med at røyking fører til lungekreft enn selve røyken, altså at røyk ikke per se fører til lungekreft.

Når funnene er konsistente i ulike kulturer, sier vi at de er kulturfrie eller kulturuavhengige. Funnene er altså ikke knyttet til noe spesifikk kultur. Det betyr fremdeles ikke at forholdet må være kausalt, men det øker troverdigheten for at det er et faktisk kausalt forhold.

Dette er et inklusjonskriterium, altså et inkluderende kriterium. Mangel på oppfyllelse av dette kravet utelukker ikke kausalitet, fordi noen utfall produseres kun under uvanlige omstendigheter, eller er ikke homogene (like) i alle grupper.

7. Eksperimentelle data

Underbygges funnet av eksperimentelle data? Her tenker man hovedsakelig på dyreeksperimenter, men også forsøk gjort i cellekulturer i en petriskål. Den åpenbare fordelen med slike eksperimenter, er den vitenskapelige presisjonen. De er vanligvis er gjort i et laboratorium, hvor man får gjort nøyaktige målinger og holde de fleste tenkelige variabler konstante. Den åpenbare ulempen med slike eksperimenter, er generaliserbarheten til mennesker.

Her er det derimot også nyanser. Dyreforsøk kan være svakere og sterkere avhengig av organismen de utføres på. En studie på ikke-menneskelige primater (apekatter) er gjerne ansett som mer overførbar på mennesker enn studier på gnagere. Hvis flere dyreforsøk viser det samme (de er såkalt evolusjonært konsistente), øker også graden vår av sikkerhet til at dataene sier noe sant og meningsfullt om mennesker.

Dette er et inklusjonskriterium, altså et inkluderende kriterium.

8. Plausibilitet

Finnes det en annen plausibel forklaring? Hvilke andre alternative muligheter er det vi ikke har utforska? Da man begynte å mistenke at røyking er kausalt, begynte tobakkindustrien å komme med alternative forklaringer de mente kunne være plausible. Forurensning, stråling, biler og telefoner var noen av alternativhypotesene som ble brukt til å forklare hvorfor lungekreft økte i vestlige land på midten av 1900-tallet. Dette var selvsagt teoretisk mulig og noe som måtte testes med samme vitenskapelige rigiditet som hypotesen om at røyk forklarte økt forekomst av lungekreft. Jo mer man testet, desto mer økte plausibiliteten til at røyking er kausalt for lungekreft.

Dette er et eksklusjonskriterium, altså et ekskluderende kriterium. Vi utelukker muligheter, vi muliggjør dem ikke.

9. Analogi

Finnes det analogiske kausale forhold? Kan vi basere oss på andre lignende situasjoner for å få innsikt om denne situasjonen? Bruken av analogier, eller kanskje mer presist likhet, handler om å se om det fins lignende eller sammenligbare kausale forhold med det vi prøver å undersøke om er faktisk kausalt. Hvis vi har avdekket et kausalt forhold i en sammenlignbar situasjon, er det mer trolig at denne situasjonen er overførbar til den vi undersøker.

La oss for eksempel si at vi ønsker å undersøke om å spille mye fotball fører til bedre kondisjon. Vi veit på forhånd ikke om det gjør det, men i og med at vi veit at andre lignende sportsaktiviteter, som basketball og sport, fører til økt kondisjon, er det mer plausibelt at dette gjelder for fotball også. Vi ville vært mindre sikre på at fotball bedrer kondisjon om dette var den eneste sporten som gjorde dette.

Vi kan også for eksempel ønske å undersøke om et bestemt kosttilskudd kan forbedre kognitiv funksjon. For å vurdere kausaliteten i denne sammenhengen kan vi se på om andre kosttilskudd forbedrer det kognitive. Anta at omega-3-fettsyrer fører til økt kognitiv funksjon. Da er det mer tenkelig at dette ikke er unikt for kun omega-3-fettsyrer, men også andre kosttilskudd.

Dette er et inklusjonskriterium, altså et inkluderende kriterium.

En siste påminnelse!

Bradford Hills ni kriterier er indikative om kausalitet. Her ligger deres umiddelbare nytteverdi.

Å ikke oppfylle dem eller å oppfylle dem er imidlertid verken nødvendig eller tilstrekkelig for å bevise kausale forhold. Altså: Dersom vi huker av på alle disse, har vi ikke et endelig bevis på et kausalt forhold (derimot kan vi si at evidensen er særdeles sterk for et kausalt forhold). Likeledes, dersom vi ikke klarer å huke av på alle disse, utelukker det ikke et kausalt forhold.

I forskernes verktøykasse finner vi Bradford Hill-kriteriene