Själens spegel: Jämförelser av spontana och poserade uttryck av känslor i rösten
Praktiskt taget varje dag i våra liv drar vi slutsatser om andra individers känslor utifrån hur deras röst låter. Men kan spontana uttryck i rösten förmedla specifika känslor ute i verkliga livet, eller är det bara när skådespelare poserar uttryck som känslorna får en unik röstprofil?
Syftet med detta projekt var att utforska likheter och skillnader mellan spontana och poserade uttryck i rösten med hjälp av insamling av röstprover, lyssningstester samt akustiska analyser. Vi har besvarat frågorna 1-6 i projektplanen, i form av sju studier som är under publicering.
Studie 1: Utvärdering av en ny databas
Endast ett fåtal studier har jämfört spontana och poserade uttryck, och deras resultat går isär. Detta kan åtminstone delvis förklaras av de små stickproven av uttryck som har använts. Det inledande arbetet inom projektet ägnades sålunda åt att samla in mer representativa stickprov. Genom att samarbeta med europeiska forskare lyckades vi få tillgång till röstinspelningar från 22 separata data-set. Detta resulterade i en omfattande databas bestående av 1746 inspelningar på fem olika språk som kunde användas i våra studier.
I syfte att utvärdera databasen utförde vi en studie där samtliga röstklipp bedömdes av tal experter och amatörer, med avseende på olika aspekter. En jämförelse visade att spontana klipp överlag hade (a) lägre känslomässig intensitet, (b) mer positiv affekt, (c) fler verbala markörer (som i sig kan "avslöja" en känsla) samt (d) sämre ljudkvalitet än poserade klipp. Resultaten från studien användes för att göra lämpliga urval av stimuli till följande studier.
Studie 2: Kan lyssnare skilja på spontant och poserat uttryck?
Kan lyssnare verkligen höra skillnad på äkta och "fejkade" känslor i rösten? Tidigare studier har inte givit något entydigt svar på denna fråga (fråga 4 i vår projektplan), eftersom de inte har kontrollerat för skillnader i känslomässig intensitet. (Studier av poserat uttryck har mest fokuserat på hög intensitet, medan studier av spontant uttryck har fokuserat på låg intensitet.)
Vilka konsekvenser har då detta för försök att hitta unika röstprofiler för känslor? Plutchik (1994) har föreslagit en modell över känslors struktur, med den geometriska formen hos en upp-och-nervänd kon. Den visar att olika känslor med låg intensitet är relativt lika varandra medan olika känslor med hög intensitet är mer åtskilda. För att göra en rättvis jämförelse av spontana och poserade uttryck behöver man alltså kontrollera för intensitet.
Detta gjordes i en experimentell undersökning. Först drogs slumpmässigt såväl spontana som poserade uttryck med tre nivåer av intensitet (låg-mellan-hög), med lika många stimuli i varje kategori. (Samtliga stimuli hämtades från den tidigare nämna databasen.) Lyssnare fick sedan bedöma i hur hög grad varje uttryck var spontant ("genuint"). Resultaten var relativt entydiga: Oavsett intensitet bedömdes spontana uttryck överlag som mer "genuina" än poserade uttryck.
Studie 3: Finns det skillnader i akustiska mönster?
Eftersom lyssnare kan skilja på spontana och poserade uttryck kan man anta att de har olika akustiska mönster (fråga 3). Vi analyserade alla uttryck med avseende på 88 parametrar. För att undvika en "statistisk fiske-expedition" reducerades parametrarna via faktoranalys till 13 distinkta mått på rösten. Den effekt som var av största intresse i analyserna var interaktionen mellan typ av uttryck (spontant/poserat) och typ av känsla (t.ex. sorg). Den visar om spontana och poserade röstklipp uttrycker känslor med olika akustiska mönster.
Resultaten visade att interaktionen var signifikant för cirka 20-40% av de akustiska måtten (beroende på intensitet). Skillnaderna mellan spontana och poserade uttryck kunde i första hand hittas bland mått på tonhöjd, röstintensitet samt talhastighet. Analyser visade även på större spridning i mått mellan olika känslor i högintensiva uttryck, än i lågintensiva uttryck (fråga 2).
För att se vilka röst-egenskaper som uppfattas som spontana av lyssnare (fråga 6) beräknade vi korrelationer mellan akustiska parametrar och lyssnarbedömningar i Studie 2. Lyssnarnas bedömningar av "genuint" uttryck var korrelerade med hög ljudstyrka och snabb talhastighet. Vi fann även att en "spänd" röstkvalitet, med mycket högfrekvent energi, uppfattas som mer "genuint" känslomässig.
Studie 4: Kan diskriminationen ske på en implicit nivå?
Studierna ovan visade att spontana och poserade uttryck kan särskiljas med perceptuella och akustiska mått. Vi ville se om diskriminationen kan manifesteras även på en fysiologisk nivå (följdfråga, ej i projektplanen). Vi valde ut röstklipp med negativa känslor från databasen och skapade två block med klipp som var matchade med avseende på intensitet, känslor, osv. Den enda skillnaden var att det ena blocket bestod av spontana klipp, det andra av poserade.
Lyssnare fick i uppgift att för varje röstklipp ange om det var en man eller kvinna som talade. Under tiden mätte vi hudkonduktans, kontinuerligt blodtryck och puls hos lyssnaren. Resultat visade att samtliga autonoma mått fick signifikant högre nivåer hos deltagare när de lyssnade på spontana uttryck än när de lyssnade på poserade uttryck, trots att lyssnarna inte hade blivit uppmanade att fokusera på talets uttryck.
Studie 5: Kan spontana uttryck förmedla specifika känslor?
Tidigare studier av spontana uttryck har misslyckats med att påvisa separata kategorier av känslor i perceptuella och akustiska mått, kanske därför att de har använt uttryck med låg intensitet. Kan spontana uttryck med hög intensitet bättre förmedla specifika känslor?
Vi testade detta (fråga 1) i ett experiment, där lyssnare fick bedöma spontana uttryck med tre nivåer av känslomässig intensitet. Lyssnarnas uppgift var att ange vilken av åtta känslor som uttrycktes i respektive röstklipp. På bas av Plutchiks modell väntade vi oss att se ett s.k. dos-respons förhållande mellan den känslomässiga intensiteten och hur tydligt känslokategorierna uppfattades; detta borde visa sig i form av högre enighet bland lyssnare om vilken känsla som uttrycks i klipp med hög intensitet än i klipp med låg intensitet.
Våra resultat visade som väntat att lyssnarna var mest eniga om vilken känsla som uttrycktes i klippen med hög intensitet. I genomsnitt valde 72% av deltagarna att beskriva den uttryckta känslan med det vanligaste svarsalternativet. (Detta är cirka sex gånger högre än den nivå som vi skulle kunna förvänta oss av slumpen, givet nio svarsalternativ, 11%). Enigheten var lägre för uttryck med medel (58%) eller låg intensitet (46%).
Studie 6: Förekommer blandade känslor i rösten?
Ytterligare en faktor som kan tänkas ha betydelse för våra jämförelser är att spontana uttryck i vardagslivet kan innehålla "blandade känslor" (t.ex. både glädje och sorg), medan poserade uttryck inspelade i laboratorier vanligtvis innehåller "renodlade" känslor (t.ex. enbart glädje).
För att studera förekomst av "blandade känslor" i uttryck i rösten (fråga 5) genomförde vi en unik fältstudie. Syftet var att fånga uttryck av känslor som de förekommer helt naturligt ute i vardagslivet. Deltagare i studien fick under cirka två veckors tid bära med sig en liten digital ljudinspelare, med en diskret placerad mikrofon. Genom "upprepad mätning" kunde vi samla in ett representativt urval av uttryck.
Efter att inspelningen avslutats gick forskare igenom materialet, för att välja ut episoder som verkade kunna innehålla uttryck av känslor. Deltagarna kallades till ett återbesök, där de fick lyssna igenom de utvalda röstinspelningarna och ange vilka känslor de upplevde i respektive klipp. De kunde även rapportera "blandade känslor", samt om det inte var någon känsla alls i klippet. (För att skydda deltagarnas integritet fick de även möjlighet att godkänna klippen för lyssningstester.)
Resultaten från talarnas egna bedömningar visade att de vanligast förekommande känslorna i det inspelade materialet var glädje, irritation, ledsnad, förvåning, belåtenhet och oro. Ungefär 37% av ljudklippen innehöll "blandade" känslor, vilket visar att "blandade känslor" är relativt vanliga. Lyssningstest med naiva lyssnare visade att även de uppfattade "blandade" känslor i ungefär motsvarande grad (34%) som talarna. Det framgick även att lyssnarna för det mesta uppfattade uttryckta känslor i enlighet med vad talarna själva hade angivit. Spontana uttryck i rösten förefaller alltså kunna förmedla specifika känslor till en lyssnare på ett tillförlitligt sätt, i motsats till vad flera forskare har hävdat (fråga 1).
Slutsatser från projektet
Resultat från våra studier pekar samstämmigt på att spontana och poserade uttryck av känslor i rösten är olika - men inte på de sätt forskare vanligtvis har trott. Poserade uttryck är inte mer stereotypa än spontana uttryck; de är inte heller mindre benägna att förmedla specifika känslor till lyssnare. Spontana och poserade uttryck skiljer sig åt med avseende på mer subtila nyanser i rösten. Våra fynd har implikationer för utbildningen av psykoterapeuter, förhörsledare samt skådespelare, för vilka skillnaden mellan "äkta" och "fejkade" känslor är viktig. Resultaten ger även upphov till en kritisk följdfråga om metoder: Kan vi lita på att poserade uttryck är så lika spontana uttryck att vi kan generalisera resultat från studier som använder poserade uttryck till situationer i verkliga livet, som involverar spontana uttryck? Dessutom väcker resultaten flera andra följdfrågor. Kan man lära talare att simulera akustiska egenskaper som ger ett intryck av spontana känslor? Fungerar våra fysiologiska reaktioner på uttryck som en "somatisk markör" som hjälper oss att avgöra om andra personer är pålitliga? Hur kan projektets resultat utnyttjas för att förbättra framtida databaser? Vi ser fram emot att diskutera dylika frågor och våra fynd med forskare och allmänheten i takt med att våra artiklar blir publicerade.