Staffan Larsson

Semantisk koordinering i dialog

Inom den formella lingvistiken ges precisa analyser av språkanvändning och språklig betydelse. Bland annat ges detaljerade förklaringar av hur dialogdeltagare successivt delar med sig av information för att uppnå olika mål. Dock utgår detta forskningsfält vanligtvis från en syn på språklig betydelse som något statiskt. På senare år har psykolingvister börjat intressera sig för hur språkliga konventioner förändras i interaktion under korta tidsrymder i begränsade grupper.

Att betydelse är föränderlig och förhandlas i språklig interaktion har länge varit en utgångspunkt för till exempel kritisk diskursanalys. Varken psykolingvistiken eller diskursanalysen försöker dock ge detaljerade formella teorier, och dessa fenomen kan svårligen beskrivas utifrån existerande formell lingvistik. Följaktligen saknas en formell teori om hur språklig betydelse förhandlas i dialog. Detta projekt syftar till att utveckla en sådan teori, i form av en formell semantik som utgår från att betydelsen hos ett uttryck är dynamisk och beror av dess tidigare användning, samt en formell pragmatisk modell av de strategier som används i dialog för att samordna dialogdeltagarnas sätt att använda språkliga uttryck. Projektet kommer att genomföras i tre parallella spår: teoriutveckling, empiriska analyser av koordinering i dialog, samt implementering av datormodeller baserade på teorin. Projektet är potentiellt relevant inte bara för språkvetenskapen utan också för språkteknologin och språkfilosofin.
 

Slutredovisning

Staffan Larsson, Institutionen för lingvistik, Göteborgs universitet

2008-2012

Utgångspunkten för detta projekt är en syn på språklig betydelse som något i grunden dynamiskt och socialt. Denna syn har på senare tid vunnit allt fler anhängare; emellertid har den formella semantiken hittills inte följt med i denna utveckling. Detta projekt syftade till att utveckla en formell teori om hur språklig betydelse förhandlas och förändras i dialog, samt en formell pragmatisk modell av de strategier som används i dialog för att samordna dialogdeltagarnas sätt att använda språkliga uttryck.

Projektplanen byggde på tre parallella spår: teoriutveckling, empiriska analyser av koordinering i dialog, samt implementation av datormodeller baserade på teorin. Fokus i projektets utförande har legat på teoriutveckling, inte minst för att användningen av TTR-formalismen har visat sig mycket användbar i detta sammanhang och har genererat omfattande forskningsresultat med relevans för språkvetenskap, språkteknologi och språkfilosofi.

Den huvudsakliga skillnaden i projektets utförande jämfört med projektplanen är därför att det empiriska spåret och implementationsspåret i viss mån fått stå tillbaka till förmån för teoriutveckling. Empiridelen har begränsats till några mindre initiala korpusstudier samt en sammanställning av exempel från litteraturen om förstaspråksinlärning, vilka sedan analyserats ingående i samband med teoriutveckling och relaterade publikationer. Ett visst implementationsarbete har utförts avseende vissa syntaktiska aspekter av s.k. korrektiv återkoppling (se nedan). Ett mer omfattande implementationsarbete har också påbörjats i syfte att skapa en testbädd för vidare implementation av semantisk koordinering i dialogsystem.

Projektets tre viktigaste resultat

1. En formell semantik för betydelsesamordning
Idén att använda typteori (TTR) för att beskriva strukturerade och dynamiska ordbetydelser har slagit väl ut och teorin har utvecklats substantiellt under projektet.

Kopplingen mellan språket och världen har inom den formella semantiken traditionellt analyserats med hjälp av s.k. modellteorietisk semantik, där betydelse antas vara i grunden extensionell (Larsson 2011a). Till exempel är betydelsen av "blå" mängden av alla blåa ting. Problemet är att detta synsätt osynliggör flera viktiga aspekter av språklig betydelse, framför allt (1) språklig betydelse är relaterad till perception och (2) språklig betydelse är "öppen" och förhandlingsbar, d v s det går inte alltid att säga vad ett uttrycks extension är på ett abstrakt och kontextoberoende sätt. Den inom projektet utvecklade teorin fokuserar istället på de språkliga uttryckens intensionala betydelseaspekt, alltså de "metoder" som används av talarna av ett språk för att relatera språkliga uttryck till världen (och andra språkliga uttryck).

För att representera språkliga uttrycks betydelser används TTR (eng. "Type Theory with Records"). TTR integrerar logiska tekniker som bindning och lambdakalkyl med objekt som liknar den formella syntaxens s.k. "feature structures". Detta ger mer struktur än vad som är tillgängligt t ex i unifieringsbaserade grammatiska system. Dessa egenskaper är viktiga för ett enkelt kunna definiera betydelseuppdateringar. De logiska aspekterna är viktiga för att relatera vår semantik till den modell- och bevisteorietiska traditionen som förknippas med formell semantik.

I Cooper (2012) framläggs den senaste publicerade versionen av TTR och relationen till teorin av semantisk koordinering som har utvecklats i detta projekt. I synnerhet tas upp relationen till "frame semantics" (ramsemantik) som det har utvecklats av Fillmore som har lett till utvecklingen av FrameNet (https://framenet.icsi.berkeley.edu). Det föreslås att record types är en lämplig formalisering av frames och spelar en viktig roll i en redogörelse för hur betydelse kan skapas eller modifieras under ett samtals gång. Huvuddrag av detta argument presenterades i ett konferenspapper Cooper (2010).

2. Dialogdrag för betydelsekoordinering i förstaspråksinlärning
Vad gäller pragmatisk teori har en preliminär taxonomi över samtalsstrategier för betydelsekoordinering i förstaspråksinlärning utvecklats och formaliserats (Larsson & Cooper 2009). Här urskiljs ett antal återkommande interaktionsmönster såsom korrigerande återkoppling:

A: Fin björn
B: Ja, det var en fin panda

Här ger B positiv återkoppling till huvuddelen av A:s yttrande, men dessutom korrigeras A:s användning av uttrycket "björn" och "panda" föreslås som det korrekta uttrycket. Utifrån dylika interaktionsmönster och relationer mellan yttranden kan samtals-deltagarna skapa hypoteser om den korrekta användningen av olika uttrycks betydelser.

Utöver korrektiv återkoppling har även andra samtalsstrategier studerats: explicita verbala definitioner (Cooper & Larsson 2009), ostensiva definitioner (t ex att peka på en färg och säga "blå") (Larsson 2011b), och ackommodering, d v s tyst anpassning till en observerad innovativ användning av ett uttryck (Larsson 2010).

3. Flerdimensionella betydelserepresentationer
Inom den formella semantiken har analys och representation av språklig betydelse tidigare i huvudsak begränsat sig till kompositionella och extensionella (se ovan) aspekter av betydelse. I projektet har en mer komplex syn på språklig betydelse inkorporerats i en formell semantisk teori, där inte bara kompositionell utan även ontologisk och perceptuell betydelse tas med. Därtill kan teorin användas för att ge detaljerade beskrivningar av stegvis språklig förändring.

I Cooper & Larsson (2009) presenteras ett antal exempeldialoger från litteraturen om förstaspråksinlärning, där barn förefaller lära sig ordbetydelser från korrektiv återkoppling. En distinktion görs mellan kompositionell och ontologisk betydelse. Kompositionell betydelse representationer av språklig betydelse som kan användas för att härleda ett komplext uttrycks (t ex. en sats) betydelse från betydelsen hos de ingående deluttrycken. Ontologisk betydelse relaterar ett uttryck till andra uttryck i språket; ett exempel att en vante är ett klädesplagg. I artikeln föreslås också ett sätt att göra denna distinktion mellan kompositionell och ontologisk betydelse i TTR.

I Larsson (2011b) utvidgas teorin till att också hantera s.k. perceptuell betydelse; se avsnitt 4 nedan. 

Nya forskningsfrågor som har genererats genom projektet 

- Hur interagerar kompositionella, ontologiska och perceptuella aspekter av betydelse, t ex med avseende på kompositionalitet?

- Hur kan teorin utvidgas till att även hantera konnotations- och funktionsaspekter av betydelse?

- Hur kan TTR-teorin om semantisk koordinering implementeras i dialogsystem baserade på informationstillstånd?

Projektets två viktigaste publikationer

Cooper & Larsson (2009): Här läggs grunden för den TTR-baserade teorin om förhandling av flerdimensionell betydelse, dels genom en beskrivning av ett antal centrala dialogstrategier, dels genom en formell semantik som medger gradvisa betydelseförändringar, samt slutligen genom att dialogstrategier och formell semantik länkas samman.

Larsson (2011b): Här utvidgas teorin om flerdimensionell betydelse till att också hantera s.k. perceptuell betydelse. Grundtanken är att språklig betydelse relaterar till perception på så sätt att (vissa) ord har en perceptuell betydelsekomponent som utgörs av en s.k. klassificerare som tar perceptuella data (signaler från sinnesorgan) som input och avgör om dessa data ska klassificeras som en instans av ordets betydelse eller ej. Detta illustreras med ett enkelt "spel" där en "lärare" lär en "elev" betydelse av ordet "höger" genom att placera objekt inom en ram och antingen säga "höger" eller "inte höger". Genom att klassificera objektets position som "höger" eller ej, och jämföra detta med vad läraren säger kan eleven detektera situationer där klassificeraren ger "fel" resultat. I sådana lägen kan eleven modifiera sin klassificerare, vilket är ett exempel på semantisk koordinering av perceptuell betydelse i dialog. Några viktiga framsteg som redovisas i denna artikel är:

- Språk och perception relateras genom att kompositionell, ontologisk och perceptuell betydelse representeras i ett gemensamt ramverk

- Perceptuell betydelse ses som klassificerare av sensorisk input, vilket öppnar för en sammankoppling av formell semantik och den omfattande forskningen om statistisk klassificering

- Teorin passar väl in i ett väletablerat teoretiskt ramverk för implementation av dialogsystem som utgår från informationstillstånd och hur dessa uppdateras

Andra typer av förmedling av projektets resultat

Föreläsningar och seminarier:

- Robin Cooper, Staffan Larsson: Towards a formal view of corrective feedback. Dialogue Matters Final Workshop, June 2, 2008, London.

- Robin Cooper, Staffan Larsson: Towards a formal view of coordination and learning in dialogue. Coordination of Agents Workshop, November 4th-5th 2008, London.

- Staffan Larsson: Do Dialogues Have Content? Workshop on Dialogue and Inference: Queen Mary University of London, Wednesday 27th October.

- Staffan Larsson and Robin Cooper: Semantic Coordination in Dialogue. NordLing PhD course on topics in Language & Cognition. Hosted by the Faculty of Humanities, NTNU - Trondheim, Norway September 6-9th, 2010. (http://www.hf.ntnu.no/sprakprosesseringslab/ResearchSchool/NordLing.html)

Projekthemsida: http://www.flov.gu.se/forskning/forskningsprojekt/allman-sprakvetenskap/semantisk-koordinering/
 

Bidragsförvaltare
Göteborgs universitet
Diarienummer
P2007-0717:1-E
Summa
SEK 1 740 000
Stödform
RJ Projekt
Ämne
Jämförande språkvetenskap och lingvistik
År
2007