Lasse Mårtensson

Nya ögon på Sveriges medeltida skrivare. Skrivarattribution med digital paleografi i den medeltida gotiska skriften

Detta projekt syftar till att utveckla och utvärdera digitala metoder för skrivarattribuering i den medeltida gotiska skriften, den i särklass mest brukade skrifttypen i det medeltida Europa. Det banbrytande med projektet ligger på det metodologiska planet, i det att det att det är uppbyggt av en kombination av högsta kompetens inom den traditionella filologin och världsledande teknik inom digital bildanalys och maskininlärning, som gemensamt kartlägger skriftens egenskaper. Projektet är således utpräglat mångvetenskapligt. De digitala metoderna fokuserar på de små kännetecknen hos skrivtecknen, de s.k. mikropaleografiska dragen. Dessa har med stor enighet betraktats som de mest kännetecknande ur ett individuellt skrivarperspektiv, men de är svåra, ofta omöjliga, att mäta och kvantifiera med manuella metoder. Materialet utgörs av den fullständiga korpusen med medeltida originaldiplom på fornsvenska (ca 14 000 texter). De medeltida diplomen är synnerligen lämpliga för attribueringsstudier, eftersom de är daterade och ortfästa, och det gör att de utgör fasta hållpunkter för framtida studier av kronologisk och geografisk variation hos skrift, språk osv. Resultaten från projektet kommer att revolutionera forskningen på det aktuella materialet, och metoderna kommer att bli centrala för i princip all forskning som rör handskriven text. Framför allt visar projektet på de möjligheter som finns i kombinationen mellan humanistisk forskningen och digital teknik.
Slutredovisning
Projektets syfte samt utveckling

Det övergripande syftet med projektet har varit att studera skrivprocessen hos de medeltida svenska skrivarna, bl.a. med hjälp av digitala metoder från bildanalys/maskininlärning samt datorlingvistik. Ett särskilt fokusområde har varit digital paleografi, dvs. studiet av skriftens fysiska utformning med digitala redskap. Projektgruppens sammansättning har haft en tyngdpunkt inom detta område, med flera seniora forskare inom bildanalys/maskininlärning samt två postdoktjänster (uppdelade på tre personer). Inom den digitala paleografin har vi undersökt skriftegenskaper som indikerar tillkomsttid (i dateringssyfte) och individualitet (i attributionssyfte).

För att ge en bredare bild av de medeltida skrivarnas verksamhet har vi också inkluderat ett delsyfte som rör språk och text ur ett skrivarperspektiv, också här med inslag av digitala metoder. Frågor som har varit av intresse inom detta område har varit t.ex. vilka faktorer som har styrt skrivarnas val i den språkliga utformningen av de medeltida urkunderna. Dessa frågor är särskilt centrala för de svenska skrivare som var verksamma under senmedeltiden, en tid när det svenska språket förändrades kraftigt. Språk- och textperspektivet har varit i fokus under den senare delen av projektet, och arbetet har gett inspiration till kommande forskningsuppgifter (se nedan under Nya forskningsfrågor).


Kort om genomförandet

Projektet har förlöpt enligt plan. Inledningsvis var Högskolan i Gävle förvaltare, och därefter flyttades projektet till Stockholms universitet och till sist till Uppsala universitet. Projektmötena har dock under hela perioden hållits i Uppsala. Det aktuella projektet följde direkt på ett tidigare VR-projekt med ungefär samma personal (projektledare Anders Brun, Inst. för IT, Uppsala universitet), och i hög utsträckning övertogs arbetsformerna från VR-projektet till det här aktuella. Det betyder att kontinuiteten i projektgruppen är mycket lång.

Under projekttiden har tre postdokar varit anställda, samtliga med inriktning mot bildanalys/maskininlärning. En av dessa, Fredrik Wahlberg, har varit placerad vid Institutionen för lingvistik och filologi. Sukalpa Chanda innehade den andra postdoken, med placering på Inst. för IT. Efter att ha rekryterats till en fast anställning på Østfold University College (Department of Computer Science and Communication) lämnade Chanda tjänsten och ersattes då av Ekta Vats, också med placering på Inst. för IT. Genom Ekta Vats har projektets arbete knutits till det relativt nyinrättade Centrum för digital humaniora vid Uppsala universitet, eftersom Ekta Vats fick en tjänst som forskningsingenjör vid detta centrum.


Projektets tre viktigaste resultat, samt ett resonemang om projektets slutsatser

Under den aktuella rubriken kommer tre resultatområden att framhållas som speglar projektets tvärvetenskapliga prägel. Det första handlar om resultaten ur ett paleografiskt perspektiv, det andra faller inom det text- och språkinriktade spåret och det tredje rör arbetsformerna. De paleografiska respektive de text- och språkinriktade spåren rymmer olika typer av metoder och frågeställningar. Inom projektet hålls de likväl ihop av att det i båda fallen är en fråga om att i detalj följa de medeltida skrivarna i spåren, och om att kartlägga vilka följder deras val får för de skrivna urkundernas utformning. I många undersökningar inom exempelvis historisk lingvistik, där man försöker säga något generellt om språkets utveckling, glömmer man ofta bort att det vi har bevarat i handskrifter och diplom är resultatet av enskilda individers skrivarinsatser. I detta projekt har perspektivet varit det motsatta: skrivarna i sig har varit i fokus.

Det första centrala resultatet rör, som nämnts, skriftens utformning, och detta ska exemplifieras utifrån en artikel publicerad i projektets slutskede (2021 i Arkiv för nordisk filologi). Fokus i denna undersökning var på skrivtecknens proportioner, dvs. proportionerna mellan höga, medelhöga och låga skriftkomponenter. Hur höga är de höga staplarna i exempelvis ’b’, ’h’ och ’l’ i förhållande till de låga staplarna i ’i’, ’m’ och ’n’, och i sin tur i förhållande till låga komponenterna i ’g’, ’p’ och ’q’? Detta har i tidigare forskning framhållits som ett möjligt skrivarindividuellt drag, men utan digital hjälp är det omöjligt att mäta det med någon större precision. Denna undersökning var den första mätningen av skriftproportionerna i nordisk medeltida skrift. Undersökningen visade att skrivarna visserligen var relativt konsekventa i proportionerna hos skriften, men de kunde likväl variera dem om t.ex. utrymmet krävde en mer hoptryckt skrift. Bilden var liknande i många paleografiska undersökningar; variationen hos en enskild individ avseende många skriftegenskaper är ofta betydande. Det innebär att bilden av en viss skrivares skrift framträder vid en kombination av många olika mått, inte genom en enskild skriftegenskap.

Det andra centrala resultatet rör den språkliga utformningen i senmedeltida svenska textvittnen. Under senmedeltiden ersattes den äldre fornsvenskans fyrkasussystem med det nuvarande tvåkasussystemet, och en stor mängd lågtyska ord kom in i språket. Det innebar att skrivarna tvingades ta ställning till en betydande språklig variation. Skrivarnas egen språkliga norm kan ha varit en förändrad morfologi, med det nuvarande tvåkasussystemet, medan förlagan som de skrev av kunde ha en språkform i det äldre fyrkasussystemet. En undersökning av ett antal textvittnen av en viss text, producerade under och direkt efter tiden för det nämnda kasussammanfallet, visade att skrivarna tenderade att bortse från den egna språkliga normen och istället helt återge förlagans språkform. Det betyder att skrivarna verkligen följer sin förlaga på en detaljnivå, mycket nära och utan ansatser att införa de egna språkliga formerna. Detta är viktig information för exempelvis forskning i svenska språkets historia under medeltiden, eftersom språkformen i ett visst textvittne kan ha traderats under många avskriftsled, och ha sitt ursprung långt tillbaka i tiden i förhållande till den bevarade handskriften.

Den sista punkten vi vill framhålla i projektet är projektgruppens tvärvetenskapliga sammansättning. Det har varit mycket stimulerande att arbeta i en grupp med mycket olika ämnesområden kring en gemensam frågeställning. Mötet mellan nordisk filologi och bildanalys/maskininlärning har lett till mycket intressanta insikter, samtidigt som vi också har blivit medvetna om de utmaningar ett sådant arbete innebär. Det är nödvändigt att arbeta under en längre tid, med kompetens från både filologi och datavetenskap i tätt samarbete, för att de digitala metoderna, ofta framtagna för andra ändamål, ska kunna anpassas för det aktuella syftet. Under tiden när projektet har pågått har miljöer inom digital humaniora vuxit fram vid flera lärosäten, såväl i Sverige som internationellt. Denna typ av tvärvetenskapligt arbete har utgjort grunden i vårt projekt, och vi har också varit verksamma i anslutning till sådana miljöer, både i Uppsala och annorstädes. Vårt projekt har i hög grad har bidragit till att utveckla den datorstödda forskningen på handskrivet material i stort i Sverige. Vi har lagt en viktig grund för kommande projekt inom detta område, för oss själva och andra.


Nya forskningsfrågor

Projektet har pågått under lång tid och med stora resurser, och många nya frågor har väckts under arbetets gång. Spåret med digital paleografi innehåller många möjligheter till framtida arbete även om projektet har nått sitt slut. Projektet har också genererat viktiga frågeställningar inom det nämnda språk- och textspåret, som vi har för avsikt att återvända till.

Att studera den medeltida avskriftsprocessen i detalj, och att följa skrivarnas arbete med förlagorna, är en mycket viktig uppgift för såväl den historiska lingvistiken (med fokus på att undersöka språksystemets utveckling) som filologin (med fokus på att studera texternas tradering). Det finns många möjligheter att närma sig detta område, bl.a. genom att undersöka bevarade förlagor och direkta avskrifter. Vi vill undersöka möjligheterna att analysera stora mängder text med digitala redskap för att urskilja olika kronologiska lager i en viss handskrift. Som nämnts är de medeltida textvittnena med mycket få undantag avskrifter, ofta i flera steg, och varje avskriftstillfälle lämnar spår. Denna typ av undersökningar kräver dock stora mängder text i ett för ändamålet lämpligt format. Ett sådant projekt måste därför föregås av en större transkriberingsinsats, parallellt med att ny metodologi prövas ut.


Spridningen av forskningen och hur samverkan har skett

Vi har strävat efter att delta i de konferenser som vi anser har varit de mest lämpliga ur ett rent vetenskapligt perspektiv. Som exempel kan nämnas att vi har medverkat i konferensserien Digital Humanities in the Nordic and the Baltic countries, från första konferensen (2016) till den sista (innevarande år). Vi har också prioriterat de konferenser som har fokus på nordisk filologi, t.ex. dem som arrangeras av Sällskap för östnordisk filologi, för att sprida resultaten till de viktigaste avnämarna av forskningen. På samma sätt som vi har satt filologin i fokus har vi också deltagit i renodlade konferenser inom bildanalys, t.ex. International Conference on Document Analysis and Recognition (ICDAR).

Projektpublikationerna har med ett undantag publicerats med Open Access, i de kanaler vi har bedömt som de viktigaste inom våra respektive ämnesområden. Avseende nordisk filologi kan man t.ex. nämna Arkiv för nordisk filologi (ej open access) och Svenska fornskriftsällskapets serie för monografier. Vi har också publicerat artiklar i tidskrifter inom digital humaniora, t.ex. Nordic Digital Humanities Journal (Vol. 14).
Bidragsförvaltare
Uppsala universitet
Diarienummer
NHS14-2068:1
Summa
SEK 13 429 000
Stödform
Nya utsikter för humaniora och samhällsvetenskap
Ämne
Språkstudier
År
2015