Thomas Hörberg

Språkbearbetning i diskurs: samverkan mellan produktion och förståelse av grammatiska funktioner i korta berättelser

Inom detta projekt undersöker jag talspråksbearbetning – produktion och förståelse av transitiva satser som t ex (i) ‘Hon vattnar blommorna’. Fokus ligger på hur bearbetningen av de grammatiska funktionerna subjekt, ‘Hon’ i (i), och objekt, ‘blommorna’ i (i), påverkas av huruvida satser förekommer i passande diskurser bestående av korta berättelser. Projektet består av tre experimentella studier vilka undersöker bearbetning av subjektsinitiala - som (i) - och objektsinitiala - såsom (ii) ‘Blommorna vattnar hon’ – satser. Dessa satser ingår i korta berättelser. Studie 1 undersöker hur talare uttrycker transitiva skeenden, och huruvida de oftare använder strukturellt tvetydiga satser som (ii) då diskursen kan underlätta förståelsen för en potentiell lyssnare. Studie 2 undersöker om diskursen faktiskt underlättar förståelse i dessa fall, genom att mäta processvårigheter vid förståelse av strukturellt tvetydiga satser som (ii), utifrån lyssnarnas hjärnaktivitet. Genom att mäta ögonrörelser undersöker Studie 3 om lyssnare kan förutsäga grammatiska funktioner i strukturellt tvetydiga satser som (ii), när satserna förekommer i diskurser som underlättar förståelse. Projektet kommer att tillhandahålla nya kunskaper om förhållandet mellan språkprocessning på satsnivå och på diskursnivå, och om förhållandet mellan språkproduktion och språkförståelse. Det kommer också att komplementera många preliminära resultat från tidigare studier då det använder naturliga experiment.
Slutredovisning
1. Introduktion
Projektet initierades i början av 2019 och avslutades juni 2022. Covid-pandemin hade en stark inverkan på datainsamlingen och påverkade därmed projektets tidsplanering, och planerna behövde ändras därefter. Trots detta har projektet breddat vår teoretiska förståelse för språkprocessning och gett nya och banbrytande resultat som bidragit till den internationella forskningsfronten. Projektet har resulterat i internationella samarbeten och presenterats i flera internationella tidskrifter och konferenser.

Slutredovisningen är strukturerad på följande vis. I avsnitt 2 ("Forskningsmål") presenteras en kort introduktion av syftet med forskningsprojektet och dess forskningsfrågor. I avsnitt 3 ("Covid-pandemins inverkan") presenteras konsekvenserna av covid-pandemin på projektet. I avsnitt 4 ("Individuella studier") presenteras en översikt över strukturen, metodologin och resultaten (om sådana finns) av de enskilda studierna. Avsnitt 5 ("Sammanfattning") ger en sammanfattning av alla studiernas resultat. I avsnitt 5 ("Vetenskaplig spridning") sammanfattas den vetenskapliga spridning och de samarbeten som projektet resulterat i.

2. Forskningsmål
Projektet undersöker talspråksprocessning av transitiva meningar på svenska som (i) "Flickan retar pojken". Det undersöker hur de grammatiska funktionerna hos subjektet, "flickan", och det direkta objektet, "pojken", språkligt inkodas vid språkproduktion, å ena sidan, och propositionellt avkodas vid språkförståelse, å andra sidan. Grammatiska funktioner möjliggör för oss att kommunicera om hur deltagare eller föremål är relaterade till händelser eller tillstånd. Vår förståelse för hur vi processar dem är därför avgörande för vår kunskap om hur vi förstår och producerar språk mer generellt.

Mycket forskning har gjorts om hur olika informationstyper (dvs språkliga ledtrådar) påverkar produktion och förståelse av grammatiska funktioner i enskilda meningar. Mindre är dock känt om de processer som använder sådana språkliga ledtrådar till grammatiska funktioner under online-förståelse. Språkliga ledtrådar kan antingen ha en särställd roll vid språkprocessning, eller så kan deras påverkan härröra från implicita förväntningar som är baserade på hur de är distribuerade i tidigare språklig input. Det är också oklart hur ledtrådar på satsnivå används i naturliga diskurser, såsom berättelser, där andra ledtrådar på diskursnivå finns tillgängliga. Syftet med detta projekt är därför att undersöka hur processningen av grammatiska funktioner i svenska påverkas av samspelet mellan språkliga ledtrådar, och hur detta samspel påverkas av tillgången till en naturlig diskurs. Projektet behandlar följande forskningsfrågor:

• Är processningen av språkliga ledtrådar till grammatisk funktion förväntansbaserad, dvs är den beroende av hur dessa ledtrådar är distribuerade i tidigare språklig input?

• Balanserar talare sin användning av ledtrådar till grammatiska funktioner på satsnivå på ett kommunikativt effektivt sätt även när ledtrådar på diskursnivå finns tillgängliga i diskursen?

• Kan processvårigheter på grund av konflikter mellan ledtrådar till grammatiska funktioner undvikas eller mildras om en naturlig diskurs är tillgänglig?

• Kan en oväntad tillskrivning av grammatiska funktion förutsägas under språkförståelse om en naturlig diskurs finns tillgänglig?

Projektet består av en förväntningsbaserad, Bayesiansk modell av inkrementell tillskrivning av grammatisk funktion (studie 0), ett meningsproduktionsexperiment (studie 1), ett event-related brain potentials (ERP) experiment (studie 2) och en eyetracking-studie (studie 3).

3. Effekterna av covid-pandemin
Arbetet med stimulansmaterialet för studierna 1-3 tog längre tid än beräknat. Stimulansmaterialet var färdigt i början av projektets andra år, 2020 (det var mycket svårt att förutse hur lång tid detta arbete skulle ta). Det fanns därför ingen tid att testköra EEG- och eyetracking-studien under 2019.

När covid-pandemin bröt ut i början av 2020 fick datainsamlingen skjutas upp ytterligare eftersom fonetiklabbet stängdes. En forskningsassistent som skulle arbeta med datainsamling anställdes i början av 2020, men hans kontrakt sades upp och sköts upp till början av höstterminen 2020. Datainsamlingen för studie 1 avslutades därför i slutet av oktober 2020. Datainsamling för studie 2 avslutades i slutet av januari 2021 och datainsamlingen för studie 3 slutfördes i början av juli 2021.

På grund av denna försening behövde projektplanerna anpassas. I april 2020, mitt under pandemin, påbörjades därför arbetet med en förväntningsbaserad, Bayesiansk modell av inkrementell tillskrivning av grammatisk funktion. Detta arbete, hädanefter kallat "Studie 0", genomfördes i samarbete med professor Florian Jaeger vid institutionen för hjärna och kognitiv vetenskap vid Rochester University, NY.

I skrivande stund har en tidskriftsartikel om Studie 0 (dvs den Bayesianska modellen och en empirisk validering av modellens förutsägelser baserat på tidigare insamlade data) publicerats i den akademiska tidskriften "Frontiers in Psychology". Studie 1 har avslutats och publicerats i den akademiska tidskriften "Language, Cognition and Neuroscience". Även data från studie 3 har analyserats och analysen av data från studie 2 har påbörjats.

4. Individuella studier

4.1. Studie 0: en förväntningsbaserad modell av inkrementell tolkning av grammatisk funktion

4.1.1. Introduktion och bakgrund
En uppsjö studier har visat att olika språkliga ledtrådar används under inkrementell språkförståelse, som exempelvis vid tillskrivning av grammatisk funktion. Både morfosyntaktiska (t ex kasusmarkering och ordföljd) och semantiska ledtrådar (t ex animacitet) används. Mindre är känt om de kognitiva processer som utnyttjar dessa ledtrådar. Språkliga ledtrådar kan ha en privilegierad roll vid språkprocessning i bemärkelsen att de utgör en speciell typ av information för språkprocessning (se t ex Bornkessel-Schlesewsky & Schlesewsky 2006). Eller så skiljer sig inte språkliga ledtrådar från andra informationstyper. Istället kan deras betydelse som ledtrådar härröra från statistiska egenskaper i hur de är distribuerade i tidigare språklig input. Enligt detta synsätt är språkprocessning förväntningsbaserad: språkprocessning använder sig av statistiska regelmässigheter i informationsflödet under inkrementell tolkning, och processvårigheter beror på avvikelser från förväntningar i det inkommande informationsflödet.

I studie 0 presenterar jag en inkrementell, Bayesiansk, förväntningsbaserad modell av inkrementell tillskrivning av grammatisk funktion. Denna modell är tränad på distributionen av språkliga ledtrådar och deras samverkan i transitiva satser, insamlade från en korpus av transitiva satser i skriven svenska (se Hörberg, 2016; 2018). Modellen utvärderas sedan mot experimentella data från en lässtudie som samlades in under mitt doktorandprojekt (Hörberg, 2016). Utvärderingen sker med en jämförelse mellan den förväntningsbaserade modellen och en ledtrådsbaserad modell, vad gäller hur väl dessa modeller kan beskriva den empiriskt insamlade läsdatan.

Nedan ger jag en översikt över den förväntningsbaserade modellen. Jag beskriver sedan kort experimentet och presenterar slutligen resultaten och analyserna som jämför den förväntningsbaserade modellen med den ledtrådsbaserade modellen.

4.1.2. En förväntningsbaserad modell av inkrementell tolkning av grammatisk funktion
Under språkförståelseprocessen uppdaterar läsaren eller lyssnaren stegvis sina implicita förväntningar om den underliggande meningstolkningen allt eftersom ny information blir tillgänglig i signalen (Hale, 2001; Levy, 2008). I förväntningsbaserade modeller innebär meningstolkning ett kontinuerligt skifte från en initial (prior) till en uppdaterad (posterior) sannolikhetsfördelning över möjliga tolkningar. Denna process kallas "Bayesian beliefupdating". Processkostnaden hos ny input bestäms delvis utifrån hur mycket ny information som den inputen tillhandahåller – graden av förändring i förväntningar om meningstolkningen (Levy, 2008). Denna förskjutning kan kvantifieras med hjälp av "Bayesian surprise", vilket är samma sak som Kullback-Leibler (KL) divergensen mellan en posterior sannolikhetsfördelning och en prior sannolikhetsfördelning över möjliga tolkningar.

Modellen behandlar typiska svenska transitiva satser med subjekt-objekt (SO)-ordföljd, och objekt-initiala satser med objekt-verb-subjekt (OS)-ordföljd (Hörberg, 2018). Modellen beräknar Bayesian surprise vid den första nominalfrasen, verbet/verben, samt den andra nominalfrasen i sådana satser, vad gäller tillskrivning av grammatisk funktion (SO eller OS). Modellen uppskattar därmed förändringen i förväntningar om huruvida den första eller den andra nominalfrasen är subjektet i satsen, baserat på ledtrådar som finns tillgängliga vid konstituent Ci (t ex den andra nominalfrasen) i relation till ledtrådarna som finns tillgängliga vid konstituent Ci-1 (t ex den första nominalfrasen och verbet).

För att beräkna Bayesian surprise för en konstituent måste de relevanta (prior och posterior) sannolikhetsfördelningarna uppskattas. I modellen görs detta utifrån korpusdata. Korpuset består av 16 552 transitiva satser från Svensk Trädbanks trädbank (Nivre & Megyesi, 2007). Dessa meningar är typiska transitiva meningar med SVO-ordning, objekt-initiala transitiva satser med OVS-ordning och adverbial-initiala satser med VSO- eller VOS-ordning. Satserna är annoterade för morfosyntaktisk (t.ex. kasusmarkering, hjälpverb), syntaktisk (t ex huvud- eller bisats), och semantiska (t.ex. animacitet) ledtrådar. Bayesian surprise beräknas för tre positioner i satser: vid den första nominalfrasen, vid verbet, samt vid den andra nominalfrasen. Detta beräknas utifrån sannolikhetsfördelningen för OS vs SO-ordning vid fyra olika positioner i satserna: (i) vid satsstarten, (ii) efter första nominalfrasen, (iii) efter första nominalfrasen och verbet, och (iv) efter första nominalfrasen, verbet och andra nominalfrasen. Bayesian surprise vid första nominalfrasen är KL-divergensen mellan sannolikhetsdistributionen för OS vs. SO efter att första nominalfrasen har påträffats (ii) och sannolikhetsdistributionen av OS vs. SO vid satsstarten före första nominalfrasen (i), och så vidare. Dessa distributioner av OS vs OS-ordning vid (i)-(iv) beräknas med hjälp av fyra separata Bayesianska multilevel logistisk regressionsmodeller. Var och en av dessa fyra modeller inkluderade de ledtrådar som finns tillgängliga vid motsvarande position i satsen.

4.1.3. Test av modellens förutsägelser
Modellens förutsägelser testades mot reaktionstider från ett självpacerat läsexperiment utfört av Hörberg (2016). Stimulansmaterialet bestod av transitiva meningar med pronominella subjekt (1:a eller 2:a person). Dessa satser varierade med hänseende på ordföljd (SVO eller OVS), animacitet hos objektet (animat eller inanimat) och semantisk typ av verb (viljestyrt verb eller upplevelseverb). Experimentet innehöll också utfyllnadsmeningar för att säkerställa att det fanns satser med substantiviska subjekt. Experimentdeltagarna läste meningar ett ord i taget genom att själva exponera efterföljande ord med en knapptryckning. Tidsintervall mellan knapptryckningar antas spegla processkostnader. Dessa reaktionstider bör korrelera med modellernas förutspådda Bayesian surprise.

Effekterna av språkliga ledtrådar på reaktionstiderna uppvisar ett mönster som rent kvalitativt liknar ledtrådarnas effekt på Bayesian surprise. Statistiska analyser visar också på ett kvantitativt förhållande mellan Bayesian surprise och reaktionstider.

Som ett sista steg jämförde vi också den förväntningsbaserade modellens förmåga att förutsäga reaktionstider med förutsägbarheten hos en "språklig" modell, som förutsäger reaktionstider direkt från ledtrådarna (dvs ordföljd, animacitet, och verbklass). Denna analys visade att den förväntningsbaserade modellen presterar lika bra som den språkliga modellen. Med andra ord, Bayesian surprise fångar till stor del samma prediktiva information om reaktionstider som de språkliga ledtrådarna gör direkt. Detta ger starkt stöd för det förväntningsbaserade perspektivet eftersom vår beräkning av Bayesian surprise med nödvändighet innehåller mindre information (vad gäller antal frihetsgrader) om reaktionstider än den information som tillhandahålls av de språkliga ledtrådarna direkt. Resultaten tillhandahåller därför starkt stöd för teorin att processkostnader förknippade med språkliga ledtrådar medieras av Bayesian surprise, och att tillskrivning av grammatisk funktion är förväntningsbaserad.

4.2. Studie 1: Talare balanserar ledtrådar till grammatiska funktioner i informativa diskurser

4.2.1. Introduktion och bakgrund
Studie 0 visar att språkliga ledtrådar används på ett sannolikhetsbaserat sätt under språkförståelseprocessen. Processkostnader kan förutsägas utifrån den grad som språkliga ledtrådar bryter mot förväntningarna av tillskrivning av en specifik grammatisk funktion (t ex förväntad SO-ordföljd). Studie 1 undersöker om talare balanserar sin användning av språkliga ledtrådar till grammatiska funktioner på ett kommunikativt effektivt sätt. Studien undersöker med andra ord om talare undviker att använda överflödiga ledtrådar för att minska sina produktionskostnader, men bara i den mån budskapet innehåller tillräckligt med ledtrådar för att lyssnaren ska kunna tillskriva grammatiska funktioner. Även om vissa studier ger belägg för att grammatisk inkodning påverkas av kommunikativ effektivitet (Kurumada & Jaeger 2015; Hörberg, 2018), har dessa belägg främst varit indirekta (baserat på korpusdata eller data från minnesstudier). Ingen studie har heller undersökt om talare balanserar sin användning av ledtrådar på ett kommunikativt effektivt sätt i naturliga diskurser, där andra ledtrådar på diskursnivå finns tillgängliga. Det är möjligt att ledtrådar på diskursnivå räcker för tolkning, vilket gör behovet av ytterligare ledtrådar på satsnivå överflödigt. Studie 1 undersöker därför om talare balanserar sin användning av ledtrådar till grammatiska funktioner på ett sätt som både undviker redundans, å ena sidan, och som är otvetydigt för åhöraren, å den andra, även när meningarna produceras i naturliga diskurser. Som studie 0 visar, fungerar animacitet (dvs om en nominalfras refererar till en levande varelse eller inte) som en viktig ledtråd till grammatiska funktioner (subjekt tenderar att vara animata). Studie 1 undersöker därmed om talare balanserar sin användning av morfosyntaktiska ledtrådar (t ex ordföljd och kasusmarkering) med hänseende till animacitet.

4.2.2. Material och metoder
Studie 1 är ett bildbeskrivningsexperiment där deltagarna beskriver transitiva händelser i korta berättelser som presenteras med tecknade bilder (liknande Prat-Sala & Branigan, 2000). Berättelserna består av scener, presenterade en i taget, som är uppdelade i tre delar. I del 1 introduceras berättelsens huvudperson ("Detta är Eva") och sammanhanget denne befinner sig i ("Hon är chef på ett bemanningsföretag"). Del 2 och 3 innehåller två separata scener. I den första scenen presenteras antingen två andra individer ("Innan lunch intervjuade Eva en man och en kvinna") eller två föremål ("Innan lunch fick Eva flera fakturor och en delrapport"). I den andra scenen interagerar huvudpersonen med de två andra individerna eller de två objekten. Det väsentliga med dessa händelser är att de involverar en opposition i hur huvudpersonen interagerar med de två individerna eller objekten. Sådana händelser kan beskrivas med en kontrastiv konstruktion. I sådana konstruktioner signaleras oppositionen i interaktionen genom att det direkta objektet placeras satsinitialt, vilket resulterar i OVS-ordföljd (Hörberg, 2018). Dessa händelser kan alltså beskrivas med en transitiv mening med antingen SO- ("Hon gillade mannen, men inte kvinnan" / "Hon betalade fakturorna, men glömde rapporten") eller OS-ordföljd ("Mannen gillade hon, men kvinnan gillade hon inte" / "Fakturorna betalade hon, men rapporten glömde hon"). Del 2 och 3 skiljer sig åt med avseende på animaciteten hos objektsreferenterna och kallas därför för den "animata" och den "inanimata" händelsen. I varje enskild berättelse ingår både en animat och en inanimat händelse. Antingen presenteras den animata först och den inanimata sist, eller tvärt om. I den första händelsen lyssnar deltagarna på en SVO-sats eller en OVS-sats som beskriver händelsen och som ska prima deltagarna. I den andra händelsen beskriver deltagarna själva händelsen som avbildas på bilden. Med animacitet (animat eller inanimat) korsat med ordföljd (SVO eller OVS), innehåller experimentet fyra bildbeskrivningsbetingelser: Animat / SVO-priming, Animat / OVS-priming, Inanimat / SVO-priming och Inanimat / OVS-priming.

Berättelserna spelades in i ett ekofritt rum vid institutionen för lingvistik vid Stockholms universitet. Talaren var en 45-årig kvinnlig professionell talcoach från Stockholmsområdet. Bilderna som används i berättelserna ritades av en professionell konstnär. Dessa består av teckningar på 59 individer, 33 föremål, 32 inanimata händelser och 32 animata händelser. Två uppsättningar av 16 hela berättelser med en animat och inanimat händelse konstruerades. Fyra berättelseversioner, motsvarande vart och ett av de fyra villkoren, konstruerades för var och en av berättelserna, vilket resulterade i 16 (berättelse) × 2 (uppsättning) × 4 (betingelser) = 128 berättelser totalt.

Totalt utförde 65 personer med svenska som modersmål (39 kvinnor) experimentet. Deras medianålder var 27 år och de hade en åldersspridning mellan 18 till 68 år. Deltagarna informerades om experimentets förfarande och de försiktighetsåtgärder som vidtagits för att minimera risken för spridning av Covid-19-viruset. De blev också informerade om att de kunde sluta när som helst utan att behöva uppge någon anledning. De lämnade skriftligt informerat samtycke. Yttranden som inte överensstämde med instruktionerna för experimentet exkluderades från vidare analys.

4.2.3. Förutsägelser
Som förklarats ovan skiljer sig händelserna som ska beskrivas med avseende på objektsreferentens animacitet. Om talare tar hänsyn till animacitet vid inkodning, bör händelser med animata objektsreferenter oftare beskrivas med OVS-ordföljd. Om talare tar hänsyn till tillgängligheten av ledtrådar till grammatiska funktioner mer generellt, bör OVS-ordföljd också användas oftare tillsammans med andra morfosyntaktiska ledtrådar, och sådana ledtrådar bör förekomma oftare i satser med två animata nominalfraser.

4.2.4. Resultat och diskussion
Som bekräftas av statistiska analyser produceras OVS-ordföljd oftare i beskrivningar av inanimata händelser. De statistiska analyserna visar också att OVS-ordföljd används oftare när det direkta objektet är inanimat (oberoende av händelsetyp), när subjektet är kasusmarkerat (dvs består av ett personligt pronomen), och när andra syntaktiska ledtrådar till grammatiska funktioner är tillgängliga (t ex ett adverbial). Ytterligare analyser visade också att kasusmarkering används oftare i meningar med animata direkta objekt, oberoende av ordföljd. Analyserna visade dock inte på effekt av primingtyp. OVS-ordföljd används mer eller mindre lika frekvent i beskrivningarna av både SVO- och OVS-primingberättelser.

Sammantaget visar dessa resultat att talare balanserar sin användning av både semantiska och morfosyntaktiska ledtrådar till grammatiska funktioner när de producerar meningar i en naturlig diskurs som är informativ om grammatiska funktioner i sig. OVS-ordföljd förekommer oftare när andra ledtrådar till grammatiska funktioner är tillgängliga. Med andra ord, talare föredrar att använda alternativa ordföljdsmönster som OVS-som är potentiellt tvetydigt med avseende på grammatiska funktioner-endast när andra ledtrådar finns tillgängliga, även om diskursen tillhandahåller tillräcklig information för lyssnaren. Talare verkar också balansera sin användning av andra ledtrådar som kasusmarkering och animacitet.

4.3. Studie 2: Minskas processvårigheter vid tillskrivning av grammatisk funktion av en naturlig diskurs?

4.3.1. Introduktion och bakgrund
Tidigare studier (t.ex. Hörberg et al. 2013) och studie 0 visar att processvårigheter vid tolkning av transitiva satser härrör från i vilken utsträckning språkliga ledtrådar bryter mot förväntningarna på tillskrivning av grammatisk funktion. Dessa studier har dock endast undersökt processning av satser som presenteras isolerat, utanför en diskurs. Sammanhanget kan ge ytterligare ledtrådar till grammatiska funktioner, vilket eventuellt gör behovet av ledtrådar på satsnivå överflödigt. Processning kanske därför inte påverkas av tillgängligheten av ledtrådar på satsnivå i sammanhängande och informativa diskurser.

Syftet med studie 2 var således att undersöka om processvårigheter vid tillskrivning av grammatisk funktion i talspråksförståelse (som resultat av konflikter mellan ledtrådar på satsnivå) påverkas av den information som finns tillgänglig i diskursen.

4.3.2. Material och metoder
Studien är en event-related brain potentials (ERP) studie, där deltagarna lyssnar på korta berättelser. För att säkerställa att deltagarna är uppmärksamma på berättelserna får de besvara förståelsefrågor efter vissa berättelser. Den beroende variabeln i experimentet är ERP-vågen på subjektspronomenet i OVS-meningar. I sådana meningar disambiguerar subjektspronomenet meningen mot OVS, vilket ger upphov till en specifik typ av ERP-våg (se Hörberg et al. 2013). Amplituden på denna våg bör påverkas av tillgängligheten av andra ledtrådar på satsnivå (dvs animacitet) och/eller ledtrådar på diskursnivå (dvs diskurskoherens, se nedan).

Berättelserna liknar i hög grad de i studie 1. Den största skillnaden är att de bara innehåller en händelse som antingen är animat (dvs animata berättelser) eller inanimata (dvs inanimata berättelser). Denna händelse beskrivs antingen med en SVO- eller OVS-sats. I den första scenen presenteras huvudpersonen och sammanhanget denne befinner sig i ("Detta är Eva. Hon arbetar som chef för ett bemanningsföretag"). Den andra scenen introducerar antingen två andra individer ("Innan lunch intervjuade hon en man och en kvinna") eller två inanimata föremål ("Innan lunch fick hon flera fakturor och en delrapport"). I den tredje, kritiska scenen presenteras en kontrastiv händelse där huvudpersonen interagerar antingen med de två andra individerna eller de livlösa föremålen. Dessa händelser beskrivs med en transitiv mening med antingen SVO-ordföljd ("Hon gillade mannen, men inte kvinnan" / "Hon betalade fakturorna, men glömde rapporten") eller OVS-ordföljd ("Mannen gillade hon, men kvinnan gillade hon inte" / Fakturorna betalade hon, men rapporten glömde hon").

För att kontrollera för påverkan av diskursen på processning av de kritiska meningarna, innehåller experimentet även kontrollberättelser som matchas till de kritiska berättelserna. Dessa skiljer sig bara från de kritiska berättelserna i den andra scenen där de två individerna eller föremålen introduceras. I kontrollberättelserna introduceras aldrig de två individerna eller föremålen, utan istället används ett mer generellt yttrande ("Inför lunch intervjuade hon några sökande" / "Före lunch hade hon mycket att göra"). I detta sammanhang blir den kommande kontrastiva händelsen i den slutliga kritiska scenen oväntad. Processningen av de potentiellt tvetydiga OVS-meningarna bör därför inte underlättas av kontexten i kontrollberättelserna.

Med den kritiska meningstypen (SVO eller OVS) korsad med animacitet (animat eller inanimat) och diskursktyp (kritisk eller kontroll), resulterar detta i åtta betingelser: SVO-meningar med inanimata objekt, SVO-meningar med animata objekt, OVS-meningar med inanimata objekt och OVS-meningar med animata objekt, antingen förekommande i kritiska sammanhang eller i kontrollsammanhang.

Experimentet innehöll också utfyllnadsberättelser där de kritiska scenerna beskrivs med SVO-satser där subjektet är lexikalt (t.ex. "kvinnan") och objektet är pronominellt (t.ex. "honom"). Detta säkerställer att deltagarna utsätts för SVO-satser med både pronominella (kritiska meningar) och lexikala subjekt (utfyllnadssatser), så att en initial lexikal nominalfras inte alltid medför OVS-ordföljd.

Förståelsefrågorna som presenterades efter vissa berättelserna bestod av öppna frågor (t ex "Vad jobbar Eva som?") som besvarades genom att välja ett av två alternativ (t.ex. "chef" eller "lärare"). Dessa användes för att säkerställa att deltagarna var uppmärksamma på berättelsens innehåll under hela experimentet.

Två uppsättningar med 16 hela berättelser skapades. Fyra berättelseversioner, motsvarande vart och ett av de fyra betingelserna, konstruerades för var och en av berättelserna, vilket resulterade i 16 (berättelse) × 2 (uppsättning) × 4 (betingelse) = 128 berättelser totalt. Två uppsättningar utfyllnadsberättelser inkluderades också, vilket resulterade i totalt 160 berättelser.

Totalt utförde 47 personer med svenska som modersmål (30 kvinnor) experimentet. Deras medianålder var 29 år och deras åldersspridning var 18 till 58 år. De informerades om det experimentella förfarandet och de försiktighetsåtgärder som vidtagits för att minimera risken för spridning av Covid-19-viruset. De blev också informerade om att de kunde sluta när som helst utan att behöva uppge någon anledning. De lämnade skriftligt informerat samtycke.

Data från studie 2 har ännu inte analyserats.

4.4. Studie 3: Vid språkförståelse kan en oväntad tillskrivning av grammatisk funktion förutsägas med hjälp av animacitet

4.4.1. Introduktion och bakgrund
Studie 3 undersöker i vilken utsträckning ledtrådar till grammatiska funktioner på sats- och diskursnivå kan användas för att förutsäga grammatisk funktion hos en kommande nominalfras redan innan denna nominalfras nämns. Detta görs utifrån det experimentella paradigmet som kallas "visual world paradigm" (t.ex. Altman & Kamide, 1999). I den här typen av experiment används eyetracker för att spåra deltagarnas ögonfixeringar av objekt och händelser i visuella scener, samtidigt som deltagarna lyssnar på talat språk. Deltagarna antas rikta sin blick mot det som för tillfället processas. Med hjälp av denna metod har tidigare studier visat att personer kan förutse uppkommande information i ett yttrande redan innan denna information presenteras, om meningskontexten är tillräckligt begränsad.

Syftet med studie 3 är därför att undersöka om subjektsreferenten i en talad transitiv sats kan förutsägas redan innan den nämns, när ytterligare ledtrådar till grammatiska funktioner på både menings- och diskursnivå finns tillgängliga.

4.4.2. Material och metoder
Studie 3 är en "visual world"-eyetrackingstudie. Deltagarna lyssnar på berättelser medan individerna och föremålen i berättelserna presenteras visuellt på en datorskärm och deltagarnas blick registreras. Deltagarnas ögonfixeringar antas spegla vad de just nu processar i berättelserna. Den oberoende variabeln är därmed andel ögonfixeringar som deltagarna gör mot bilden av subjektsreferenten i berättelsernas slutscen, där de kritiska OVS-meningarna presenteras. Om deltagarna kan använda objektets animacitet och informationen i diskursen för att förutsäga den kommande nominalfrasens grammatiska funktion, bör objektets animacitet och diskursens koherens resultera i en högre andel fixeringar mot subjektsreferenten redan innan subjektsnominalfrasen nämns i berättelsen. På samma sätt som i studie 2 får deltagarna förståelsefrågor efter vissa berättelser för att säkerställa att de förblir uppmärksamma.

Berättelserna som används i studie 3 är identiska med de som används i studie 2. De skiljer sig dock åt med avseende på bilderna. Eftersom studie 3 är en "visual word"-eyetrackingstudie är bildpresentation en avgörande del av studien. Endast bilder på deltagarna och/eller på föremålen i berättelserna presenteras. Bilderna justerades storleksmässigt för att passa till experimentet och presenterades på följande sätt i varje scen i berättelserna. I den första scenen presenteras bara huvudpersonen i mitten av skärmen. I den andra scenen positioneras antingen de två individerna eller de två föremålen i mitten, slumpmässigt till vänster och till höger på skärmen. I den tredje scenen presenteras huvudpersonen och antingen de två individerna eller de två föremålen slumpmässigt på den övre centrerade, nedre vänstra och nedre högra skärmpositionen. Ett litet antal berättelser innehöll en andra huvudpersonsbild. I dessa placerades båda huvudpersonerna i mitten, slumpmässigt till vänster eller till höger i den första scenen. I den tredje och sista scenen presenterades båda huvudpersonerna tillsammans med antingen de två individerna eller de två föremålen. Dessa fyra bilder placerades slumpmässigt i den övre vänstra, övre högra, nedre vänstra och nedre högra skärmpositionen.

I den första scenen presenteras bilden på huvudpersonen med en förhandsvisningstid på 500 ms. Med andra ord visas bilden 500 ms innan yttrandet påbörjas. I den andra och tredje scenen används å andra sidan en bildförhandsvisningstid på 2000 ms. Detta bör ge deltagarna tillräckligt med tid att bekanta sig med bilderna innan yttrandena börjar (Huettig & McQueen 2007; Huettig & Guerra 2019).

Liksom i studie 2 innehöll även studie 3 utfyllnadsberättelser där de kritiska scenerna beskrivs med SVO-satser med lexikala subjekt är och pronominella objekt, för att säkerställa att en initial lexikal nominalfras inte alltid medför OVS-ordföljd. Förståelsefrågor efter vissa berättelser användes igen för att säkerställa att deltagarna förblev uppmärksamma på berättelsens innehåll under hela experimentet. Liksom i studie 2 användes totalt 160 berättelser (16 (berättelser) × 2 (uppsättningar) × 4 (betingelser) = 128 kritiska berättelser; 16 (berättelser) × 2 (uppsättning) = 32 utfyllnadsberättelser).

Totalt utförde 48 personer med svenska som modersmål (30 kvinnor) experimentet. Deras medianålder var 30,5 år och deras åldersspridning sträckte sig från 18 till 68 år. Deltagarna informerades om det experimentella förfarandet och de försiktighetsåtgärder som vidtagits för att minimera risken för spridning av Covid-19-viruset. De blev också informerade om att de kunde sluta när som helst utan att behöva uppge någon anledning. De lämnade skriftligt informerat samtycke.

4.4.3. resultat och diskussion
Påfallande nog är det bara i de inkongruenta kontrolldiskurserna som animacitet väsentligt påverkar andelen ögonfixeringar på subjektsreferenten. I dessa diskurser uppvisar deltagarna en större andel ögonfixeringar mot subjektsreferenten i inanimata händelser direkt efter bildpresentationen. Men framförallt visar deltagarna också en ökad andel ögonfixeringar mot subjektsreferenten efter presentationen av verbet. Detta tyder på att deltagarna förutsäger den uppkommande subjektsreferenten vid denna tidpunkt. I de kongruenta diskurserna skiljer sig däremot andel ögonfixeringar mot subjektsreferenten knappast åt som funktion av animacitet. Detta indikerar att tolkningsprocessen inte påverkas av animacitet i någon högre utsträckning i koherenta diskurser där tillskrivning av grammatisk funktion kan förutsägas utifrån diskurskontexten.

5. Sammanfattning
Detta projekt har bidragit starkt till vår förståelse av processning av grammatiska funktioner i svenska transitiva meningar, både vad gäller avkodning under förståelse och med avseende på i kodning under produktion. Mer specifikt har projektet tillhandahållit ytterligare insikter om hur olika typer av språkliga ledtrådar – både semantiska såväl som morfosyntaktiska – används under on-lineprocessning.

Projektet har gett nya insikter om de underliggande kognitiva processerna som använder språkliga ledtrådar vid inkrementell språkförståelse. Det tillhandahåller robusta belägg för idén att inkrementell tillskrivning av grammatisk funktion vid språkförståelse är förväntningsbaserad: effekten av språkliga ledtrådar vid inkrementell tillskrivning av grammatisk funktion härrör från implicita förväntningar som är baserade på hur dessa ledtrådar är distribuerade i tidigare språklig input.

Projektet har också gett nya insikter om hur språkliga ledtrådar på satsnivå används i naturliga diskurser där andra till grammatiska funktioner finns tillgängliga på diskursnivå. Vid språkproduktion balanserar talare sin användning av ledtrådar till grammatiska funktioner på satsnivå på ett kommunikativt effektivt sätt, även om det finns ytterligare ledtrådar på diskursnivå tillgängliga. Med andra ord, de val som talare gör under grammatisk inkodning påverkas av en avvägning mellan motivationen att undvika produktionskostnader och motivationen att vara tillräckligt informativ för lyssnaren. Även om tidigare studier har gett indirekta belägg för detta (t.ex. Hörberg, 2018; Kurumada & Jaeger 2015), är detta den första studien som tillhandahåller direkta, experimentella belägg, och som även tar hänsyn till ytterligare information i diskursen. Vid språkförståelse kan lyssnare använda språkliga ledtrådar till grammatiska funktioner på satsnivå, som exempelvis animacitet, för att förutsäga den grammatiska funktionen hos en kommande nominalfras redan innan denna nämns. Dessa resultat ger starka belägg för idén att tillskrivning av grammatisk funktion sker snabbt och inkrementellt. Åhörare gör preliminära tillskrivningar av grammatisk funktion utifrån den information som för närvarande finns tillgänglig i signalen, även innan hela meningen har presenterats (Hörberg et al. 2013, Hörberg & Jaeger, 2021). Ledtrådar till grammatisk funktion på satsnivå är dock mindre informativa i diskurser som ger ytterligare information om grammatiska funktioner på diskursnivå (som kontrastiva sammanhang).

Sammantaget illustrerar dessa fynd en viktig diskrepans mellan produktion och förståelse i informativa diskurser: även om ledtrådar till grammatiska funktion på satsnivå är redundanta i informativa diskurser ur ett tolkningsperspektiv, är talare fortfarande känsliga för deras tillgänglighet och balanserar sina yttranden med hänseende till dessa.

6. Vetenskaplig spridning
Detta projekt har hittills resulterat i två publikationer i internationella tidskrifter av högsta klass, fyra presentationer vid några av de mest prestigefyllda internationella psykolingvistiska konferenserna, två nationella konferenspresentationer, samt ett seminarium vid Goethe-universitetet i Frankfurt och en vid Centrum för lingvistisk teori och studier i sannolikhet (CLASP) vid Göteborgs universitet. Projektet har medfört internationella samarbeten med forskare från University of Rochester, Rochester, USA, från Technische Universität Kaiserslautern, Kaiserslautern, Tyskland, från George Washington University, Washington, USA och från Goethe University i Frankfurt, Tyskland. Nedan följer en lista över publikationer, konferenspresentationer och föredrag.

6.1. Tidsskriftartiklar
Hörberg, T. & Sjons, J. 2022. Speakers balance their use of cues to grammatical functions in informative discourse contexts. Language, Cognition and Neuroscience. https://doi.org/10.1080/23273798.2022.2102667.

Hörberg, T. & Jaeger, F. 2021. A rational model of incremental argument interpretation: the comprehension of Swedish transitive clauses. Frontiers in Psychology, 12:674202 (special issue on rational approaches in language sciences). https://doi.org/10.3389/fpsyg.2021.674202

6.2. Konferenspresentationer
Hörberg, T. & Jaeger, F. 2021. Bayesian surprise predicts incremental processing of grammatical functions. Presentation at the 34th Annual CUNY Conference on Human Sentence Processing, on-line. Available at http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-194176

Hörberg, T. 2020. Expectation-based encoding of grammatical functions in spoken discourse contexts. Poster presentation at The 26th Architectures and Mechanisms for Language Processing Conference (AMLaP), on-line, University of Potsdam. Available at https://osf.io/dkt85/files/

Hörberg, T. 2019. The Processing of Grammatical Functions in Swedish is Expectation-based. Presentation at Rational Approaches in Language Sciences (RAILS) 2019, Saarland University, Saarbrücken, Germany. Available at http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-185242.

Hörberg, T. 2019. The Processing of Grammatical Functions in Swedish is Expectation-based. Presentation at The Swedish Workshop on Data Science (SweDS) 2019, Royal Institute of Technology (KTH), Stockholm, Sweden. Available at http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-185240.

Hörberg, T. 2019. The Processing of Grammatical Functions in Swedish is Expectation-based. Poster presentation at Discourse Expectations: Theoretical, Experimental, and Computational perspectives (DETEC) 2019, Leibniz-Centre General Linguistics (ZAS), Berlin, Germany. Available at http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-185238.

Hörberg, T. 2019. Expectation-based processing of grammatical functions in Swedish. Poster presentation at the Lund Symposium on Cognition, Communication and Learning, Skissernas Museum, Lund, Sweden. Available at http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-172933.

6.3. Kollokvia och arbetsseminarier
Hörberg, T. 2019. Expectation-based processing of grammatical functions in Swedish. Invited talk at the CLASP seminar, Centre for Linguistic Theory and Studies in Probability (CLASP), Dept. of Philosophy, Linguistics and Theory of Science, University of Gothenburg, Gothenburg.

Hörberg, T. 2021. Is the encoding of grammatical functions during spoken language production expectation-based? Invited talk at the Psycholinguistics Colloquium, Dept. Linguistics, of Goethe University Frankfurt, Frankfurt, Germany (on-line).

Hörberg, T. 2019. Language processing in natural discourse - exploring the interplay between language production and comprehension of grammatical functions in short story contexts. Dept. of Linguistics, SU.

Referenser
Altmann, G. T. M., & Kamide, Y. (1999). Incremental interpretation at verbs restricting the domain of subsequent reference. Cognition, (73), 247–264.

Bornkessel, I., and Schlesewsky, M. (2006). The extended argument dependency model: A neurocognitive approach to sentence comprehension across languages. Psychol. Rev. 113, 787–821. doi:10.1037/0033-295X.113.4.787.

Hale, J. (2001). “A Probabilistic Earley Parser as a Psycholinguistic Model,” in Proceedings of NAACL, 159–166.

Hartsuiker, R. J., & Westenberg, C. (2000). Word order priming in written and spoken sentence production. Cognition, 75(2), B27–B39. https://doi.org/10.1016/S0010-0277(99)00080-3

Hörberg, T. (2016). Probabilistic and Prominence-driven Incremental Argument Interpretation in Swedish [PhD thesis, Stockholm University]. https://su.diva-portal.org/smash/get/diva2:924838/FULLTEXT01.pdf

Hörberg, T. (2018). Functional motivations behind direct object fronting in written Swedish: A corpus-distributional account. Glossa: A Journal of General Linguistics, 3(1), 81. https://doi.org/10.5334/gjgl.502

Hörberg, T., Koptjevskaja-Tamm, M., and Kallioinen, P. (2013). The neurophysiological correlate to grammatical function reanalysis in Swedish. Lang. Cogn. Process. 28, 388–416. doi:10.1080/01690965.2011.651345.

Huettig, F., & Guerra, E. (2019). Effects of speech rate, preview time of visual context, and participant instructions reveal strong limits on prediction in language processing. Brain Research, 1706, 196–208. https://doi.org/10.1016/j.brainres.2018.11.013

Huettig, F., & McQueen, J. M. (2007). The tug of war between phonological, semantic and shape information in language-mediated visual search. Journal of Memory and Language, 57(4), 460–482. https://doi.org/10.1016/j.jml.2007.02.001

Kurumada, C., & Jaeger, T. F. (2015). Communicative efficiency in language production: Optional case-marking in Japanese. Journal of Memory and Language 83, 152–178.
Levy, R. (2008). Expectation-based syntactic comprehension. Cognition 106, 1126–1177. doi:10.1016/j.cognition.2007.05.006.

Nivre, J., and Megyesi, B. (2007). “Bootstrapping a Swedish Treebank Using Cross-Corpus Harmonization and Annotation Projection,” in Proceedings of the 6th International Workshop on Treebanks and Linguistic Theories, eds K. de Smedt, J. Hajic and S. Kübler, 97–102.

Prat-Sala, M., & Branigan, H. P. (2000). Discourse Constraints on Syntactic Processing in Language Production: A Cross-Linguistic Study in English and Spanish,. Journal of Memory and Language, 42(2), 168–182. https://doi.org/10.1006/jmla.1999.2668
Bidragsförvaltare
Stockholms universitet
Diarienummer
P17-0536:1
Summa
SEK 2 295 000,000
Stödform
RJ Projekt
Ämne
Jämförande språkvetenskap och lingvistik
År
2017