Sören Edvinsson

POPLINK - en världsunik resurs för nydanande forskning om människa och samhälle i ett långt tidsperspektiv


Projektet syfte är att digitalisera och tillgängliggöra befolkningsdata på individnivå från Umeåregionen, 1900-1950, för forskning, inom ramen för den nya flergenerationsdatabasen POPLINK, en infrastruktur av internationellt hög klass som byggs upp vid Demografiska databasen, Umeå universitet. Tillförlitliga metoder att länka samman befolkningsdata från 17-, 18-, och 1900-talen med moderna registerdata gör det för första gången möjligt att bygga en forskningsresurs som fullt ut tar till vara de informativa och högkvalitativa svenska befolkningsregistrens stora potential för longitudinella studier. Etablerat samarbete med SCB möjliggör att uppbyggnad och datalagring sker inom gällande lagstiftning under bibehållet integritetsskydd för den enskilde. Med POPLINK öppnas möjligheter till nydanande forskning inom livsvetenskaper, social, ekonomisk och samhällsvetenskaplig forskning, där flergenerationsperspektivet är väsentligt för förståelsen av samhällsförändring, förändrade livsmönster och livsvillkor i ett långt tidsperspektiv. Digitala individdata från tiden för den svenska välfärdsstatens framväxt kommer för första gången att bli tillgängliga för registerdataforskning i stor skala. Databasens storlek, generationsdjup, detalj- och variabelrikedom gör den väl lämpad för populationsbaserade studier. Digitalisering och länkning av individdata kommer att ske vid Demografiska databasen med väl beprövade system och högt ställda kvalitetskrav, under perioden 2011-2013.
Slutredovisning

Sören Edvinsson, Demografiska databasen, Umeå universitet

2010-2013

Syftet med projekt har varit att bygga upp en longitudinell befolkningsdatabas som omfattar Umeå lands- och stadsförsamling, de två yt- och befolkningsmässigt största församlingarna i Umeåregionen. Befolkningsdata från 1900 till 1950, hämtade från den svenska kyrkobokföringen, har registrerats, länkats samman på individnivå och inkluderats i en relationsdatabas, för att därefter tillgängliggöras för forskningsändamål. Projektet har drivits av Demografiska databasen vid Umeå universitet och databasuppbyggnaden har skett med etablerade metoder, väl beprövade system och högt ställda kvalitetskrav. Inga förändringar har gjorts i den initiala projektplanen. Däremot har en justering behövt göras av tidplanen för projektet, vilket redovisades redan under halvtidsutvärderingen 2012. En smärre försening har uppstått, beroende på att det faktiska antalet individnoteringar i de aktuella församlingarna under arbetets gång visade sig vara avsevärt fler än vad vi, med hjälp av våra tidigare beräkningsmodeller, kunde uppskatta vid projektstarten. Det innebär att projektet beräknas vara helt avslutat under första kvartalet 2014. En justering har därefter gjorts av våra metoder för att skatta församlingsstorlek, så att de i framtiden tar hänsyn till den betydligt större rörlighet som finns i en stadsbefolkning.

Projektets resultat

Infrastrukturprojektens speciella karaktär gör att vi i dagsläget inte kan förvänta oss några konkreta forskningsresultat utöver det faktum att vi, i enlighet med upprättad projektplan, har byggt och tillgängliggjort en högkvalitativ befolkningsdatabas med stort generationsdjup, som omfattar länkade data från Umeå landsförsamling och Umeå stadsförsamling 1900-1950. Databasens design gör att data på ett säkert och smidigt sätt kan länkas samman med andra värdefulla forskningsregister på regional och nationell nivå, inklusive de officiella register som finns vid SCB och Socialstyrelsen. Planering pågår av de första forskaruttagen med Umeådata, vilket innebär att de forskningsresultat som kommer ut av dessa kan förväntas först efter ytterligare någon tid. Ett av de första projekten kommer att röra fertilitetsnedgången på individ- och familjenivå under första halvan av 1900-talet.

Projektet har i stort följt den projektplan som finns preciserad i ansökan till Stiftelsen Riksbankens Jubileumsfond. Individdata från församlingsböcker, födelse- och dopböcker, lysnings- och vigselböcker, död- och begravningsböcker samt flyttningslängder i Umeå landsförsamling och Umeå stadsförsamling för perioden 1900-1950 har registrerats och länkats samt inkluderats i databasen POPLINK. Länkningen av inregistrerade individdata har skett enligt noggrant fastställda kriterier. En noteringslänkning knyter samman information om enskilda individer från olika källor. Därefter görs en relationslänkning som definierar relationer och släktskap, mellan makar, barn och föräldrar. Avslutningsvis görs en regionlänkning som knyter samman de olika församlingarna som infogats i befolkningsdatabasen och gör det möjligt att följa individer mellan olika församlingar i en geografisk region. Sammantaget bidrar detta till att skapa en databas som är synnerligen lämpad för livsförlopps- och flergenerationsstudier, som är användbar såväl för mikrostudier på individnivå som för projekt som kräver tillgång till omfattande datamängder. Innan tillgängliggörandet av databaserna skapas också den nyckel som medger säker och integritetsskyddad länkning till SCB-data och andra forskningsdata.

Arbetet har skett enligt en noggrant upprättad plan med löpande kvalitetskontroller och avstämningspunkter vid varje månadsskifte. Uppföljningen inkluderar nyckeltal rörande resursförbrukning i tid, produktionsresultat i antal registrerade noteringar samt produktionshastighet i relation till arbetad tid. Resultatet analyseras och återkopplas till medarbetarna, samt ligger till grund för fortsatt planering av den återstående projekttiden. Under projekttiden 2011-2013 har totalt 32 588 timmar ägnats åt arbete med Umeå landsförsamling och 20 052 timmar åt arbete med Umeå stadsförsamling. I Umeå landsförsamling har 278 562 individnoteringar registrerats och länkas. I Umeå stadsförsamling har 214 615 individnoteringar registrerats. Som tidigare kommenterats är länkningen av de återstående noteringarna i Umeå stadsförsamling något försenad och beräknas vara avslutad i början av mars 2014. Umeå landsförsamling blev färdig för forskning under kvartal 3 2013 och Umeå stad kommer således att kunna tillgängliggöras tidigt under kvartal 2 2014. Ekonomiskt har projektet följt den uppgjorda planen. RJ:s projektstöd har utgjort en delfinansiering av projektet. Huvuddelen av de personalresurser som har använts utgör DDB:s medfinansiering till infrastrukturprojektet.

Oförutsedda tekniska och metodiska problem

Som tidigare nämnts visade sig antalet individnoteringar i de båda församlingarna vara betydligt fler än vad som kunde förutses vid projektstart, vilket har lett till att projektet har försenats något i förhållande till den ursprungliga projektplanen.

Arbetets integrering i myndigheten/organisationen samt hur arbetet kommer att föras vidare

Det projekt som nu slutredovisas ingår som en del i en större infrastruktursatsning vid Demografiska databasen och Umeå universitet: uppbyggnaden av en forskningsinfrastruktur med stort generationsdjup som omfattar befolkningen i stora delar av Västerbotten under tidsperioden 1700-1950. Denna nya resurs, med vilken det blir möjligt att fullt ut ta till vara de svenska befolkningsregistrens stora potential för longitudinella studier, öppnar för nydanande forskning inom en rad vetenskapsområden där flergenerationsperspektivet kan bidra med nya insikter. Det blir exempelvis möjligt att belysa väsentliga aspekter av 1900-talets samhällsutveckling och förändrade livsmönster, välfärdsstatens framväxt och en förbättrad folkhälsa. Därutöver skapar databasens fokus på Västerbotten värdefulla synergier med flera andra unika populationsbaserade forskningsregister för regionen. En långsiktig plan har lagts upp för den framtida utvidgningen av infrastrukturen och fortsatt finansiering söks löpande, nu närmast under 2014.

Nya forskningsfrågor som har genererats genom projektet

Ett infrastrukturprojekt inbegriper inte forskning i konventionell mening, utan syftar i stället till att skapa förutsättningar för framtida forskning. Det genererar därför inte heller nya forskningsfrågor på samma sätt som andra projekt. Detta betyder dock inte att uppbyggnaden av en forskningsinfrastruktur är en förutsägbar process som alltid löper enligt föreskrivna mallar. Även under infrastrukturprojekt väcks frågeställningar som påverkar och utvecklar arbetsprocessen. Källorna i sig rymmer ständigt nya problem som behöver hanteras på ett konsekvent sätt. I många fall handlar det om tolkning och tillämpning av etablerade registreringsprinciper i förhållande till ny information och ändrade förutsättningar, men det kan också röra sig om mer komplicerade problem som kräver nytänkande och viktiga vägval. Vid Demografiska databasen dokumenteras hela produktionsprocessen mycket noggrant, inklusive de frågeställningar som behöver hanteras under arbetets gång. Detta gör det möjligt att alltid kunna kontrollera information i databasen mot ursprungskällan och se hur den har överförts och hanterats. Under arbetet med Umeåförsamlingarna har vi särskilt fått arbeta med att utveckla och förfina våra metoder och principer för att registrera och hantera boendeinformation i stadsmiljö. En tydlig spin-off effekt av projektet är också det ökade intresse för befolkningsdata från 1900-talet som vi har mött, både från forskare i Sverige och internationellt. Ett flertal kontakter har etablerats och några av dessa har resulterat i konkreta planer på uttag ur databasen och i projektansökningar till forskningsråd.

Bidragsförvaltare
Umeå universitet
Diarienummer
In10-0702:1
Summa
SEK 4 200 000
Stödform
RJ Infrastruktur för forskning
Ämne
Ospecifierad ämne
År
2010