Standarder för registrering och lagring av transkriberat svenskt dialektmaterial.
Runt omkring i landet - framförallt vid de stora universitetsorterna - finns det väldiga mängder inspelat och/eller nedtecknat svenskt dialektmaterial i olika arkiv, huvudsakligen insamlat från c:a 1870 och långt in i modern tid. Den absolut största samlingen finns vid Språk och Folkminnesinstitutet (SOFI) i Uppsala, som också är huvudman för dessa arkiv. Sammanlagt rör det sig om i storleksordningen 10.000 timmar inspelat material - det mesta ännu inte överfört till skrift, transkriberat, som termen lyder. Ett i omfattning minst lika stort material föreligger också i enbart nedtecknad form, nämligen sådant som insamlades före 1930, innan några inspelningsmöjligheter fanns.
Tanken - bl a uttryckt av kulturministern - har nu väckts att så mycket som möjligt av allt detta material skall datoriseras och göras tillgängligt via Internet, i förekommande fall både som text och ljud. De tekniska och administrativa problemen att ta hand om allt detta material är formidabla, men det aktuella projektet går närmast ut på att utveckla metoder och programvara för att mata in och lagra materialet snarare än att faktiskt göra själva inmatningen.
Vid nedteckningen av det talade materialet har det sedan 1870-talet använts ett för de svenska dialekterna specifikt avpassat fonetiskt alfabete, landsmålsalfabetet kallat. Med allehanda varianter så uppgår teckenförrådet i detta alfabete till flera tusen olika tecken; en viktig del av det aktuella projektet är att göra en inventering av detta. I många fall har också ett mer riksspråkligt anpassat skrivsätt använts, vilket gör texten mer lättillgänglig även för icke-fackmannen. Sammanfattning av projektet:
* Etablera en UNICODE-standard för lagring av text skriven i landsmålsalfabetet (genom det stora teckenförrådet i detta räcker det inte med ett normalt Word- teckensnitt, som ju max bara kan härbärgera drygt 200 olika tecken.). Vi avser också att utveckla en systematisk representation i ren 7-bits ASCII, vilken sedan kan fungera som ett effektivt växelmynt för dialekttexter.
* Etablera översättningstabeller mellan landsmålsalfabetet och det internationella fonetiska alfabetet, IPA, (lämpligen via den nämnda 7-bits- representationen) och likaså till en mer riksspråklig, förenklad representation med s.k. ljudenlig stavning. Även koppling till det motsvarande norska landsmålsalfabet är planerat.
* Utveckla programvara och tekniska hjälpmedel för inmatning av skriftligt dialektmaterial i enlighet med det ovanstående samt framställa manualer för dessa hjälpmedel.
Digital slutredovisning saknas. Den som är intresserad av resultaten kan höra av sig till rj@rj.se.