Elena Volodina

Språkteknologi för det flerspråkiga samhället. Nordisk konferens NoDaLiDa.

Den första NoDaLiDa-konferensen - Nordiska DataLingvistikDagarna - hölls i Göteborg 1977. Datalingvistik, eller språkteknologi, är ett område som på olika sätt försöker få datorer att hantera mänskligt språk, och omfattar allt från taligenkänning och talsyntes, maskinöversättning och informationssökning, till språkstöd för användare med särskilda behov samt utveckling av digitala språkresurser och infrastruktur för forskning inom andra områden, t ex digital humaniora.

Konferensen har blivit en mötesplats för forskare inom språkteknologi med fokus på de nordiska och baltiska språken och organiseras vartannat år av Northern European Association for Language Technology (NEALT), med ungefär 100-150 deltagare. Fokus för konferensen har alltid varit att främja kontakter och samarbete inom de nordiska och baltiska länderna och att föra närmare språkteknologisk forskning inom de olika språken för att kunna nyttja varandras framgångar. I årets konferens sätter vi fokus på att lyfta forsknings- och utvecklingsfrågor runt flerspråkiga elektroniska resurser och algoritmer, bl a för att stödja den nya vågen av invandrare och för att föra forskning inom digitala humaniora framåt.

Nästa NoDaLiDa-konferens arrangeras av Språkbanken vid Göteborgs universitet och kommer att hållas i Göteborg, 22-24 maj 2017, exakt 40 år efter den första NoDaLiDa-konferensen.

Vi söker härmed pengar för att täcka en del av lokalkostnader samt stödja studenter och volontärer som vill delta i konferensen.
Slutredovisning

Nodalidas 40-årsjubileum, den 21:a Nordiska datalingvistikkonferensen (ursprungligen Nordiska datalingvistikdagarna), löpte av stapeln den 22–24 maj 2017 i Göteborg, där det hela en gång började, och blev en stor succé. 184 deltagare från hela världen, ett rekord i Nodalida-sammanhang, deltog i huvudkonferensen och fyra workshopar.

Språkbanken vid Göteborgs universitet hade äran att organisera Nodalida 2017, tillsammans med NEALT, the Northern European Association for Language Technology, som samordnar konferensserien. Konferensen är en mötesplats för forskare - med olika intressen, bakgrund och senioritet - i de tvärvetenskapliga ämnena datalingvistik och språkteknologi. Här får man möjlighet att mötas både för att dela med sig av och diskutera sin forskning och för att knyta professionella kontakter.

Deltagarna var forskare, studenter och representanter från näringslivet, med ett intresse för datalingvistik och språkteknologi. De kom från 24 olika länder, främst de nordiska länderna och Europa, men också längre
bort ifrån, som Hong Kong, Japan, Israel, Förenade Arabemiraten och Förenta Staterna.

Det generösa konferensbidraget från RJ användes huvudsakligen för att hålla nere konferensavgiften, i syfte att kunna attrahera så många deltagare som möjligt. Vi tänkte i det sammanhanget särskilt på  yngre forskare, som master- och forskarstudenter, för att få ett livligt utbyte och för att säkra forskningsområdets framtid. Det stora antalet deltagare visar att vi lyckades.

Den första konferensdagen hölls fyra parallella workshopar. En handlade om användningen av språkteknologi för att undervisa i och lära sig språk (med 7 presentationer och 2 inbjudna talare). En fokuserade på olika
aspekter av Universal Dependencies (24 presentationer och 2 inbjudna talare) och en annan på Constraint grammar (5 presentationer), som båda är olika sätt att beskriva språk och grammatik. Den fjärde handlade om
att bearbeta språket i historiskt material (9 presentationer och 1 inbjuden talare).

En av konferensens huvudattraktioner var de tre enastående inbjudna talarna, Kyunghyun Cho, Sharon Goldwater och Rada Mihalcea. De behandlade flerspråkighet och analys av naturligt språk ur tre olika perspektiv: att bearbeta flerspråkiga stora datamängder med neurala nätverk för mer effektiv maskinöversättning, automatisk taligenkänning, samt språkbearbetning för att extrahera information från texter i online-forum och sociala nätverk. De inbjudna talarnas föredrag spelades in och finns nu tillgängliga på nätet under minst 10 år framåt, vilket gör dem tillgängliga för en större publik, tillsammans med det övriga konferensmaterialet, se <http://nodalida2017.se/>.

Huvudkonferensen hade, utöver de inbjudna talarna, nio delvis parallella sessioner, med sammanlagt 23 presentationer som behandlade till exempel syntaktisk och semantisk uppmärkning av text, att arbeta med sociala medier, algoritmer för lexikal semantik, och maskinöversättning. Det fanns också två poster- och demosessioner, med sammanlagt 26 bidrag. Alla bidrag hade granskats med anonym referee-granskning.

Konferensvolymerna för huvudkonferensen och workshoparna har publicerats av både LiU-EP (Linköping University Electronic Press) och ACL Anthology, som båda är open-access. Linköping Electronic Conference Proceedings rankas också som nivå 1 i den norska listan över forskningspublikationer. (Se publikationerna här:

* huvudkonferensvolymen på <http://www.ep.liu.se/ecp/contents.asp?issue=131>,
* the Workshop on Processing Historical Language <http://www.ep.liu.se/ecp/contents.asp?issue=133>,
* the Workshop on NLP for Computer Assisted Language Learning and NLP for Research on Language Acquisition <http://www.ep.liu.se/ecp/contents.asp?issue=134>,
* the Workshop on Universal Dependencies <http://www.ep.liu.se/ecp/contents.asp?issue=135>, samt
* the Workshop on Constraint Grammar - Methods, Tools and Applications <http://www.ep.liu.se/ecp/contents.asp?issue=140>.

Konferensen gav flera olika möjligheter till sociala sammankomster och spontana möten för personer med gemensamma intressen, såsom en välkomstmottagning som staden Göteborg bjöd på, en konferensmiddag, luncher och fikapauser. Detta vet vi har lett till flera diskussioner och samarbeten kring framtida workshopar och projektförslag, och har även lett till nya forskningsidéer. Dessutom fanns COST-nätverk (European cooperation in science and technology) på plats och kunde attrahera nya medlemmar. Nodalida 2017 blev verkligen mötesplatsen för språkteknologi i Norden. De långsiktiga effekterna ser vi naturligtvis först längre fram, men vi förväntar oss att några viktiga initiativ kommer att mogna och förverkligas så småningom – jämförbara med organiserandet av språkbanker i de nordiska länderna (Sverige, Norge och Finland), som har uppkommit som ett resultat av tidigare Nodalida-konferenser – en utveckling som har fått långtgående effekter på den språk/text-baserade forskningen i dessa länder, inte bara inom språkteknologisk forskning, utan även vad gäller digital humaniora, språkvetenskap, undervisning m.m.

Publikationslista

 
* J Tiedemann, N Tahmasebi (eds). 2017. Proceedings of the 21st Nordic Conference on Computational Linguistics, NoDaLiDa. Sweden, Gothenburg, May 23-24. NEALT Proceedings Series 29. Linköping Electronic Conference Proceedings 131. ISSN (online): 1650-3686. 336 pages (http://www.ep.liu.se/ecp/contents.asp?issue=131)

* G Bouma, Y Adesam (eds). 2017. Proceedings of the NoDaLiDa 2017 Workshop on Processing Historical Language. Sweden, Gothenburg, May 22. NEALT Proceedings Series 32. Linköping Electronic Conference Proceedings 133. ISSN (online): 1650-3740. 58 pages. (http://www.ep.liu.se/ecp/contents.asp?issue=133)

* E Volodina, I Pilán, L Borin, G Grigonyte, K Nilsson Björkenstam (eds). 2017. Proceedings of the Joint 6th Workshop on NLP for Computer Assisted Language Learning and 2nd Workshop on NLP for Research on Language Acquisition at NoDaLiDa, Gothenburg, 22nd May 2017. NEALT Proceedings Series 30, Linköping Electronic Conference Proceedings 134, ISSN (online): 1650-3740. 67 pages. (http://www.ep.liu.se/ecp/contents.asp?issue=134)

* M-C de Marneffe, J Nivre, S Schuster (eds). 2017. Proceedings of the NoDaLiDa 2017 Workshop on Universal Dependencies, 22 May, Gothenburg Sweden. Linköping Electronic Conference Proceedings 135. NEALT Proceedings Series 31. ISSN (online): 1650-3740. 152 pages. (http://www.ep.liu.se/ecp/contents.asp?issue=135)

* E Bick, T Trosterud (eds). 2017. Proceedings of the NoDaLiDa 2017 Workshop on Constraint Grammar - Methods, Tools and Applications, 22 May 2017, Gothenburg, Sweden. NEALT Proceedings Series 33. Linköping Electronic Conference Proceedings 140. ISSN (online): 1650-3686. 31 pages (http://www.ep.liu.se/ecp/contents.asp?issue=140)

Anslagsförvaltare
Göteborgs universitet
Diarienummer
F16-1203:1
Summa
SEK 200 000,00
Stödform
Forskningsinitiering
Ämne
Språkteknologi (språkvetenskaplig databehandling)
År
2017