Bakom vetenskapen: det osynliga arbetet med datahantering i Big Science
Bland de största kvantiteterna av data i dagens datadominerade värld produceras genom experiment vid Big Science anläggningar. De är anläggningar som exempelvis CERN, där det sker banbrytande vetenskapliga upptäckter som förändrar vår förståelse av universum och utlovar svar på några av samhällets mest angelägna problem. En fundamental del i dessa vetenskapliga framsteg är produktionen av högkvalitativa och tillförlitliga data. Såväl historiskt som idag har Big Science dock tenderat att ignorera hur insamlandet, bearbetandet och lagringen av experimentella data vid dessa anläggningar formar denna nya kunskap.
Den här boken berättar historien om en unik vetenskaplig resa genom att följa de ansvariga i arbetet med att designa och implementera datahantering vid en ny Big Science anläggning, Europeiska Spallation Source (ESS) i Lund, Sverige. Boken fyller en lucka i forskningen genom att belysa rollen som datahantering har i det vidare landskapet av ett föränderligt vetenskapligt experimenterande. Boken använder sig av insikter från kritiska datastudier och vetenskaps- och teknikstudier för att undersöka hur kontexten inom vilken datan växer fram, ramar in och formar densamma.
Boken har kontrakt med Bristol University Press och är planerad att publiceras under senare delen av 2023 eller början av 2024, vilket sammanfaller med det formella öppnandet av ESS för besökare.
Den här boken berättar historien om en unik vetenskaplig resa genom att följa de ansvariga i arbetet med att designa och implementera datahantering vid en ny Big Science anläggning, Europeiska Spallation Source (ESS) i Lund, Sverige. Boken fyller en lucka i forskningen genom att belysa rollen som datahantering har i det vidare landskapet av ett föränderligt vetenskapligt experimenterande. Boken använder sig av insikter från kritiska datastudier och vetenskaps- och teknikstudier för att undersöka hur kontexten inom vilken datan växer fram, ramar in och formar densamma.
Boken har kontrakt med Bristol University Press och är planerad att publiceras under senare delen av 2023 eller början av 2024, vilket sammanfaller med det formella öppnandet av ESS för besökare.
Slutredovisning
Syftet med det här sex månader långa projektet var att färdigställa ett bokmanuskript med titeln "Behind the Science: the invisible work of data management in Big Science" kontrakterad till Bristol University Press. Jag tillbringade perioden februari till juli 2023 som besökande forskare vid Computer Architecture and VLSI (CARV) Systems Laboratory på Institute of Computer Science (ICS) vid Foundation for Research and Technology (FORTH) i Heraklion, på Kreta i Grekland. CARV etablerades 1988 och är ett ledande europeiskt laboratorium med huvudsakligt fokus på högpresterande databehandling, med sakkunskaper inom analys av Big Data. Under den här tiden arbetade jag på manuskriptet och träffade kollegor som arbetar inom detta område. Jag tog dessutom tillfället i akt att kontakta andra forskare vid FORTH med intressen som kompletterar intressena i mina andra pågående forskningsprojekt om smarta städer och AI.
Manuskriptet lämnades in till Bristol University Press i oktober 2023 och förläggaren har satt den 1 april 2024 som ett preliminärt datum för inlämning av den slutliga, tryckfärdiga versionen. Publiceringen förväntas ske under hösten 2024 och boken kommer att publiceras som Guld Open Access. Här nedan ger jag en sammanfattning av resultaten i boken, följt av uppgifter om de andra aktiviteter som uppnåtts under sabbatsperioden.
Bokresultat
Den här boken är baserad på material som har samlats in under ett tidigare (separat finansierat) projekt som undersökte föreställningen att Big Science i sig höll på att förändras på betydelsefulla sätt, i så stor utsträckning att vi kan behöva prata om en "ny" Big Science. Fokus för det projektet låg på European Spallation Source (ESS), en ny Big Science-anläggning som byggs utanför Lund.
Mitt bidrag till konversationen var att föreslå att en av de särskiljande egenskaperna för en sådan ny Big Science var en förändring i data – datavolymerna, komplexiteten för data, förändringar i användarsupport för data, vilka alla samverkade för att göra datahanteringen vid anläggningar som ESS mer synlig än någonsin. När jag slutförde den forskningen översteg det material jag hade samlat in under fältarbetet vid ESS betydligt publiceringskraven för det tidigare projektet i fråga om kvantitet och rikedom. En bok var det självklara sättet att göra rättvisa åt detta material, åt deltagarna och åt den centrala fråga som uppstod: när data är så grundläggande för experimentella resultat, varför har hanteringen av dessa data hittills fått så lite uppmärksamhet inom Big Science?
Tack vare den längre period av koncentrerad tid som denna sabbatsperiod gav, visar Bakom vetenskapen hur det specifika sammanhang som omger utvecklingen av ESS har format konstruktionen för och utvecklingen av datahanteringssystemet. Kapitlen i mitten av boken presenterar utdrag från empiriskt arbete som visar den varierande påverkan och de varierande bidrag som tekniker, personer och organisationsstrukturer har gett. I den här boken vill jag inte bara tydliggöra vikten av att förstå hur datahantering är "placerat" av dessa olika aktörer, utan också på ett tydligare sätt synliggöra de sakkunskaper som är involverade. För att göra detta använde jag mig av två analytiska tillvägagångssätt från vetenskaps- och teknikstudier: "svarta lådan" och "osynligt arbete". Att använda dessa tillvägagångssätt för att synliggöra tekniker, praxis och sakkunskaper relaterade till datahantering förde mig till en punkt där jag började tänka på experiment vid ESS ur aspekterna "på scen" och "bakom scen", en metafor som gav inspiration till titeln på den här boken. I de avslutande kapitlen utgår jag från de empiriska forskningsresultaten för att anknyta till de teoretiska debatter om rollen för "rådata" i kunskapsproduktion som äger rum inom kritiska datastudier.
Kontakter och samarbeten
Samtidigt som det viktigaste resultatet av detta projekt är inlämnandet av själva bokmanuskriptet, så har sabbatsperioden varit enormt produktiv när det gäller bredare konversationer och kontakter. Av forskare vid FORTH med erfarenhet av att utföra de typer av experiment som jag skrev om lärde jag mig mycket om arbetspraxis vid andra Big Science-anläggningar och drog nytta av deras återkoppling på texten. Av andra personer vid institutet med sakkunskaper inom området AI och maskininlärning fick jag kunskap om olika inlärningsmodeller. Det här är konversationer som jag tar med mig in i ett nytt projekt som heter "Att operationalisera etik för AI: utmaningar med översättning, implementering och ansvar", vilket ger mig chansen till ytterligare samarbete med dessa nya kontakter. Slutligen, tack vare möjligheten att ge gästföreläsningar som en del av en kurs om smarta städer vid University of Crete under min vistelse, kunde jag förmedla erfarenheter från ett annat tidigare projekt i Sverige till studenterna där, och bilda ett samarbete med forskare som arbetar med avkänningstekniker.
Spridning
Medan jag förbereder boken för tryckning, förbereder jag mig också för att sprida resultaten och marknadsföra själva boken. Planerna för detta inbegriper presentationer på relevanta större internationella konferenser, till exempel Data Power, det gemensamma sammanträdet för European Association for the Study of Science and Technology (EASST) och Society for Social Studies of Science (4S), samt årsmötet för Association of Internet Researchers. Utöver detta planerar jag att delta i mer lokala evenemang, till exempel presentationer vid svenska nationella STS-dagarna och evenemang om "rådata" på Temas DataLab vid Linköpings universitet och svenska gruppen för "Digital STS". Det teoretiska arbete som utgör en del av den här boken har gjort det möjligt för mig att samla ihop trådar som har visat sig tvärsöver olika empiriska forskningsprojekt för att formulera ett tydligt teoretiskt bidrag till området kritiska datastudier, ett bidrag som sträcker sig långt utöver själva boken för att informera forskning och undervisning på vägen framåt.
Manuskriptet lämnades in till Bristol University Press i oktober 2023 och förläggaren har satt den 1 april 2024 som ett preliminärt datum för inlämning av den slutliga, tryckfärdiga versionen. Publiceringen förväntas ske under hösten 2024 och boken kommer att publiceras som Guld Open Access. Här nedan ger jag en sammanfattning av resultaten i boken, följt av uppgifter om de andra aktiviteter som uppnåtts under sabbatsperioden.
Bokresultat
Den här boken är baserad på material som har samlats in under ett tidigare (separat finansierat) projekt som undersökte föreställningen att Big Science i sig höll på att förändras på betydelsefulla sätt, i så stor utsträckning att vi kan behöva prata om en "ny" Big Science. Fokus för det projektet låg på European Spallation Source (ESS), en ny Big Science-anläggning som byggs utanför Lund.
Mitt bidrag till konversationen var att föreslå att en av de särskiljande egenskaperna för en sådan ny Big Science var en förändring i data – datavolymerna, komplexiteten för data, förändringar i användarsupport för data, vilka alla samverkade för att göra datahanteringen vid anläggningar som ESS mer synlig än någonsin. När jag slutförde den forskningen översteg det material jag hade samlat in under fältarbetet vid ESS betydligt publiceringskraven för det tidigare projektet i fråga om kvantitet och rikedom. En bok var det självklara sättet att göra rättvisa åt detta material, åt deltagarna och åt den centrala fråga som uppstod: när data är så grundläggande för experimentella resultat, varför har hanteringen av dessa data hittills fått så lite uppmärksamhet inom Big Science?
Tack vare den längre period av koncentrerad tid som denna sabbatsperiod gav, visar Bakom vetenskapen hur det specifika sammanhang som omger utvecklingen av ESS har format konstruktionen för och utvecklingen av datahanteringssystemet. Kapitlen i mitten av boken presenterar utdrag från empiriskt arbete som visar den varierande påverkan och de varierande bidrag som tekniker, personer och organisationsstrukturer har gett. I den här boken vill jag inte bara tydliggöra vikten av att förstå hur datahantering är "placerat" av dessa olika aktörer, utan också på ett tydligare sätt synliggöra de sakkunskaper som är involverade. För att göra detta använde jag mig av två analytiska tillvägagångssätt från vetenskaps- och teknikstudier: "svarta lådan" och "osynligt arbete". Att använda dessa tillvägagångssätt för att synliggöra tekniker, praxis och sakkunskaper relaterade till datahantering förde mig till en punkt där jag började tänka på experiment vid ESS ur aspekterna "på scen" och "bakom scen", en metafor som gav inspiration till titeln på den här boken. I de avslutande kapitlen utgår jag från de empiriska forskningsresultaten för att anknyta till de teoretiska debatter om rollen för "rådata" i kunskapsproduktion som äger rum inom kritiska datastudier.
Kontakter och samarbeten
Samtidigt som det viktigaste resultatet av detta projekt är inlämnandet av själva bokmanuskriptet, så har sabbatsperioden varit enormt produktiv när det gäller bredare konversationer och kontakter. Av forskare vid FORTH med erfarenhet av att utföra de typer av experiment som jag skrev om lärde jag mig mycket om arbetspraxis vid andra Big Science-anläggningar och drog nytta av deras återkoppling på texten. Av andra personer vid institutet med sakkunskaper inom området AI och maskininlärning fick jag kunskap om olika inlärningsmodeller. Det här är konversationer som jag tar med mig in i ett nytt projekt som heter "Att operationalisera etik för AI: utmaningar med översättning, implementering och ansvar", vilket ger mig chansen till ytterligare samarbete med dessa nya kontakter. Slutligen, tack vare möjligheten att ge gästföreläsningar som en del av en kurs om smarta städer vid University of Crete under min vistelse, kunde jag förmedla erfarenheter från ett annat tidigare projekt i Sverige till studenterna där, och bilda ett samarbete med forskare som arbetar med avkänningstekniker.
Spridning
Medan jag förbereder boken för tryckning, förbereder jag mig också för att sprida resultaten och marknadsföra själva boken. Planerna för detta inbegriper presentationer på relevanta större internationella konferenser, till exempel Data Power, det gemensamma sammanträdet för European Association for the Study of Science and Technology (EASST) och Society for Social Studies of Science (4S), samt årsmötet för Association of Internet Researchers. Utöver detta planerar jag att delta i mer lokala evenemang, till exempel presentationer vid svenska nationella STS-dagarna och evenemang om "rådata" på Temas DataLab vid Linköpings universitet och svenska gruppen för "Digital STS". Det teoretiska arbete som utgör en del av den här boken har gjort det möjligt för mig att samla ihop trådar som har visat sig tvärsöver olika empiriska forskningsprojekt för att formulera ett tydligt teoretiskt bidrag till området kritiska datastudier, ett bidrag som sträcker sig långt utöver själva boken för att informera forskning och undervisning på vägen framåt.