Ingeborg Waernbaum

Statistiska metoder för skattning av marginella kausala effekter i matchade och omatchade fall-kontrollstudier

En fall-kontrollstudie är en vanlig studiedesign för att undersöka effekten av en riskfaktor på en sjukdom. Den används när vi har information om alla som har sjukdomen och vi vill jämföra dessa med friska kontroller för att undersöka effekten av en riskfaktor på sannolikheten att få sjukdomen. Projektets syfte är att utveckla nya statistiska metoder som kan användas för att skatta kausala effekter i matchade och omatchade fall-kontrollstudier. För att skatta kausala effekter i en fall-kontrollstudie måste vi i) justera för störande variabler som påverkar både riskfaktorn och sjukdomen och ii) ta hänsyn till att samplingen är biased, dvs. antalet fall är oproportionerligt stort jämfört med antalet kontroller. Om studien dessutom är matchad så att kontroller valts som har samma värden på vissa variabler (t ex ålder, kön) måste vi även ta hänsyn till matchningen i den efterföljande analysen. Etablerade statistiska metoder fokuserar på skattning av den betingade oddskvoten. Ett mått på effekten av en riskfaktor för en person med vissa karaktäristika. I projektet vill vi föreslå nya metoder för att skatta den marginella kausala oddskvoten, dvs effekten av riskfaktorn i en population. En parameter viktig för beslutsfattare men förbisedd i den statistiska litteraturen. Vi vill föreslå sätt att välja ut vilka bakgrundsvariabler vi behöver justera för samt föreslå nya metoder för att skatta långsiktiga effekter av sjukdomen på framtida utfall såsom inkomst och arbetsmarknadsutfall.
Slutredovisning

2011-2016

Projektet syftade till att utveckla statistiska metoder inom det statistiska forskningsområdet kausal inferens. Inom kausal inferens utvecklar man metoder för att skatta effekten av en behandling på olika utfall. Begreppet behandling används i en vid mening och kan avse en medicinsk behandling men även en annan åtgärd som t ex ett program eller en policy. Vi kan exempelvis vara intresserade av att mäta effekten av olika åtgärder inom arbetsmarknad och socialförsäkring som effekten av ett aktiveringsprogram för socialbidragstagare på sannolikheten att få ett arbete.
Kausala effekter kan skattas i randomiserade försök där individer slumpmässigt tilldelas behandlingar. Randomiserade försök har av etiska skäl dock begränsningar i sin tillämpbarhet för studier av individer och deras livsbanor och studier med registerdata utgör därför ofta det enda möjliga alternativet. För att skatta kausala effekter av behandlingar som inte har tilldelats slumpmässigt krävs att vi jämför behandlade och kontroller som är lika med avseende på variabler som påverkar både behandlingstilldelningen och utfallet, så kallade confounders.

I det här forskningsprojektet har vi utvecklat nya statistiska metoder för att skatta kausala effekter med hjälp av data från en fall-kontroll studie. I projektplanen beskrevs två områden med tillhörande projekt.

i) Skattning av kausala parametrar i fall-kontroll studier.
ii) Kausal inferens i en sekundär analys av fall-kontroll data.

Projektet har hållit sig till det ursprungliga syftet och de arbeten som genomförts har handlat om de två områdena som beskrevs i projektplanen.

Projektledaren, Ingeborg Waernbaum, är sedan 2009 medlem i styrgruppen för det svenska barndiabetesregistret (SCDR). De statistiska metoder som studerats i projektet har tillämpats på data från SCDR som är en databas som konstruerats med matchad fall-kontroll design.

Projektets tre viktigaste resultat
Ett viktigt resultat är förslaget av en estimator för en marginell oddskvot som tar hänsyn till att fall och kontroller har matchats på vissa variabler (Persson E., och Waernbaum I., 2013, Statistics in Medicine). I arbetet studerar vi de få tidigare resultaten och föreslår en ny estimator som vi jämför med de tidigare. Vi använder den nya estimatorn i Svenska barndiabetesregistret och analyserar effekten av låg födelsevikt på risken att få typ 1 diabetes. Analysen poängterar vikten av att ta hänsyn till matchningen eftersom en annan slutsats dras om man ignorerar matchningen jämfört med om man tar denna matchning i beaktning. I vår analys kommer vi fram till att låg födelsevikt inte signifikant bidrar till att öka risken för insjuknande i typ 1 diabetes.

Vi har ett viktigt resultat där vi presenterar en ny viktad matchningsestimator för den kausala effekten i en sekundär analys av fall-kontrolldata (Persson, E., Waernbaum, I. och Lind, T. 2016 revideras för Statistics in Medicine). Vi presenterar också en generell bias som blir resultatet om man ignorerar att den primära studien hade en fall-kontroll design. Vi beskriver biasens storlek i förhållandet till ett antal mått som forskare kan uppskatta i sina studier. Det betyder att våra resultat ger tillämpade forskare en möjlighet att uppskatta storleken på felet i tidigare studier som publicerats då man inte tar hänsyn till att data initialt samlades in i en fall-kontroll studie. I samband med att estimatorn presenteras så analyserar vi också effekten av typ 1 diabetes på risken att bli deprimerad. Vi har också gjort en studie som visar en mindre riskökning för depression för typ 1 diabetiker än de som tidigare uppmätts i studier på färre individer och där man haft tillgång till färre bakgrundsvariabler. Detta är mycket intressant eftersom svenska barndiabetesregistret och läkemedelsregistret tillhandahåller en unik möjlighet att studera frågan på ett mer övergripande sätt och vi i dessa studier fått fram ny och viktig kunskap. Manuskriptet med resultaten revideras för Statistics in Medicine och vi har förhoppningar om att det kommer att publiceras där.

Vi har studerat hur man väljer variabler för att skatta kausala effekter utan att vara beroende av modeller för hur variablerna påverkar behandlingen eller utfallet (Persson, Häggström, Waernbaum och de Luna, 2016, revideras för Computational Statistics and Data Analysis). Vi beskriver metoderna som leder till att vi kan välja ut en mängd variabler som är tillräckliga att kontrollera för när man skattar en kausal effekt. Vi genomför datorsimuleringar där vi visar hur metoderna fungerar i praktiken. Vi har också utvecklat ett statistikprogram CovSel som finns att ladda ner fritt tillgängligt (https://cran.r-project.org/) som hör till den statistiska programvaran R. Vi har också publicerat en artikel som beskriver mjukvaran (Häggström, Persson, Waernbaum och de Luna, 2015, Journal of Statistical Software).

Vilka nya frågeställningar har projektet genererat?
Projektet har genererat flera nya frågeställningar bland annat inom sekundär analys av fall-kontroll data. Vi har sett att våra resultat om sekundär analys av fall-kontroll data är mer generella än vi tänkte från början och de kan användas i alla fall där samplingen är stratifierad. Projektet har genererat nya intressanta frågeställningar om skillnader mellan betingade och marginella parametrar och vilka som kan skattas i olika datasituationer, dvs för olika sampling designer. Speciellt är resultaten intressanta att utveckla i samband med val av studiepopulation i registerstudier. Här kommer vi att intressera oss för nya projekt som vi tror kommer att vara av intresse för ett brett spektrum av registerforskare.

Hur är projektet internationellt förankrat?
Vårt forskningsområde är ett viktigt område inom statistisk forskning och ett stort internationellt forskningsområde. Waernbaum har ett viktigt kontaktnät inom ämnesområdet kausal inferens och träffar forskare inom ämnesområdet på internationella konferenser. Waernbaum blev 2013 invald i en expertgrupp för Kausal Inferens inom International Society for Clinical Biostatistics tillsammans med 4 andra forskare, Professor Els Goetghebeur (ordförande), Ghent University, Belgien, Erica
Moodie, McGill University, Kanada, Bianca de Stavola, London School of Hygiene and
Tropical Medicine, UK och Saskia le Cessie, Leiden Univeristy, Nederländerna.
Waernbaum deltar i årliga möte med United Kingdom Causal Inference Network (http://ukcim2016.lshtm.ac.uk/) hon har varit inbjuden talare på flera konferenser och seminarier.

Projektets två viktigaste publikationer
Persson, E. and Waernbaum, I. (2013). Estimating a marginal causal odds ratio in a case-control design: analyzing the effect of low birth weight on the risk of type 1 diabetes mellitus. Statistics in Medicine, 32:2500-2512.

Persson, E., Waernbaum, I. and Lind, T. (2016). Estimating marginal causal effects in a secondary analysis of case-control data. Manuscript under revision in Statistics in Medicine.

Hur ser projektets publiceringsstrategi ut? Vilken typ av publikationer kommer projektet att leda till?
Vi försöker publicera våra resultat i bästa möjliga tidskrifter inom vårt område. För att göra resultaten tillgängliga har vi köpt open access-tillägg för de publikationer som vi publicerat i tidskrifter som inte varit open access (Statistics in Medicine). Ett manuskript (Data-driven algorithms for dimension reduction in causal inference: analyzing the effect of school achievements on acute complications of type 1 diabetes mellitus) har vi publicerat på arXiv mathematics ett open access arkiv för preprints inom matematik och statistik. Den programvara vi utvecklat finns fritt tillgängligt att ladda ner.

Publikationer

Under review

Persson, E., Waernbaum, I. and Lind, T. (2016). Estimating marginal causal effects in a secondary analysis of case-control data. Manuscript under revision in Statistics in Medicine.

Persson, E., Häggström, J., Waernbaum, I., and de Luna, X. Data-driven Algorithms for Dimension Reduction in Causal Inference. Manuscript under revision in Computational Statistics and Data Analysis.

Published Papers

Waernbaum, I. and Dahlquist G. (2015). Low mean temperature rather than few sunshine hours are associated with an increased incidence of type 1 diabetes in children. European Journal of Epidemiology, 31, 61-65.

Häggström, J., Persson, E., Waernbaum, I., and de Luna, X. (2015) CovSel: An R Package for covariate selection when estimating average causal effects. Journal of Statistical Software, 68(1).

Persson, E. and Waernbaum, I. (2013). Estimating a marginal causal odds ratio in a case-control design: analyzing the effect of low birth weight on the risk of type 1 diabetes mellitus. Statistics in Medicine, 32:2500-2512.

Lind, T., Waernbaum, I. Berhan, Y. and Dahlquist, G. (2012). Socioeconomic factors rather than diabetes mellitus per se contribute to an excess use of antidepressants among young adults with childhood onset type-1 diabetes mellitus – a register-based study. Diabetologia, 55:617-624.
 

Bidragsförvaltare
Umeå universitet
Diarienummer
P11-0814:1
Summa
SEK 2 340 000
Stödform
RJ Projekt
Ämne
Sannolikhetsteori och statistik
År
2011