Ett reviderat och digitaliserat lexikon över tokhariska A
Tokhariska A och B är två indoeuropeiska språk, som är belagda genom textfragment från nuvarande Xinjang, Kina, daterade från 600-800 e.Kr. Antalet fragment är ca 4 000; 520 är skrivna på tokhariska A. De flesta A-texter finns i Berlin och publicerades i transliteration av Emil Sieg - Wilhelm Siegling 1921. Detta material finns samlat i en konkordans av Pavel Poucha, Thesaurus Linguae Tocharicae (1955), en publikation som innehåller många felaktigheter i identifikationen av enskilda lexem och textpassager. En samling fragment, som grävdes upp i Yanqi 1974, kastar nytt ljus över tidigare material och löser många av de frågetecken som finns i Pouchas Thesaurus. Projektet avser först att bygga upp en textdatabas omfattande allt A-material: Berlin- och Yanqitexterna samt opublicerade texter från Paris. Denna kommer sedan att kompletteras med textrestaureringar och korrigeringar genom integrering av en referensdatabas, innehållande hänvisningar till relevanta publikationer för enskilda textavsnitt och hela texter. Pouchas volym kommer sedan gås igenom efter ej förstådda eller felaktigt översatta lexem samt felanalyserade former. Lemmata i behov av en revidering avses att behandlas komplett och härvid kommer även motsvarande lexem och passager från parallelltexter på uiguriska och sanskrit att inkluderas. Projektets mål är att framställa en kompletteringsvolym till Pouchas Thesaurus och ordlistan över tokhariska A i Wolfgang Krause - Werner Thomas, Tocharisches Elementarbuch (1964), de lexikaliska hjälpmedel som för närvarande finns för tokhariska A.
Gerd Carling, Språk- och litteraturcentrum, Lunds universitet
Tokhariska A är ett av två indoeuropeiska språk (tokhariska A och B), som talades upp till 1000-talet i Xinjiang-provinsen, västra Kina. Det dechiffrerades för 100 år sedan, 1908, men har sedan dess utarbetats i ganska långsam takt och fortfarande saknas textutgåvor för merparten av texterna. I den ursprungliga ansökan angavs det att projektets huvudsyfte var att producera ett kompletterande lexikon till existerande ordböcker över tokhariska A, som hade stora brister. Grundvalen för en ny ordbok förelåg dels genom ett antal nya textutgåvor, dels genom en nyutgåva av en större textkorpus med ett drama på tokhariska A, Maitreyasamitinâtaka, som grävts fram under 70-talet. Ansökan avsåg att producera dels en kompletterande volym till befintliga lexika, dels en text- och referensdatabas, som skulle kunna användas som ett hjälpmedel för textläsning och översättning.
Arbetet skulle utföras av Gerd Carling i samarbete med professor Georges-Jean Pinault, Paris, och professor emeritus Werner Winter, Kiel.
Arbetet påbörjades 2003. Redan till sommaren 2003 förelåg en fullständig men preliminär version av databasen och senare samma år också en ganska allmän skiss av en version av det "kompletterande" lexikonet. Projektmedarbetarna blev snart eniga om att detta material bäst skulle publiceras i form av ett nytt lexikon och därför påbörjades utarbetandet av en mer komplett lexikon/tesaur, som skulle inkludera alla förbättringar av översättningar och textläsningar, nyöversättningar, nytillkomna lexem, nya texter och förbättringar, uppnådda genom identifiering av parallelltexter.
Det framstod inom kort att lexikonet i denna form skulle komma att uppgå till nästan 800 sidor och bli ganska omfattande. Projektet fick stöd från SCAS, Uppsala, genom att Gerd Carling gavs möjlighet att tillbringa ett år (2004-2005) på detta institut för att kunna arbeta med ordboken. Under denna tid färdigställdes också en komplett, men preliminär version av en tredjedel av hela ordboken (a-j) Det bestämdes då att ordboken skulle ges ut i tre volymer på Otto Harrassowitz förlag.
Därefter påbörjades en genomgång av hela materialet. Det bestämdes att den reviderade version av hur tokhariskans verbstammar, som utarbetats av Werner Winter, skulle användas konsekvent. Vidare skulle man inkludera alla de hittills opublicerade texter på tokhariska A, som efter projektets start gjorts offentliga via internet. Det visade sig, efter sortering och läsning av originalen, att dessa uppgick till 619 stycken, det vill säga fler än den ursprungliga korpusen. Därefter skulle lexikonet korrekturläsas i minst två omgångar av samtliga projektmedarbetare, vilket innebar igen en stor mängd revideringar och förbättringar. Första delen av lexikonet inklusive inledning och referenser kommer att tryckas under våren 2008. Det andra viktiga resultatet av projektet har varit databasen, som blivit en förutsättning för lexikonets processande och som kommer att spela en ännu viktigare roll i framtiden, om vissa justeringar av sökmotorerna kan genomföras och korpusen utvidgas med samtliga texter. Databasen har förbättrats parallellt med lexikonet. Den innehåller även översättningar och information om manuskriptnummer, referenser till foto, innehåll, översättning, kommentar, eventuell parallelltext osv. Databasen har varit det viktigaste redskapet i utarbetandet av lexikonet, eftersom textexempel först korrigeras i denna och sedan hämtas härifrån till själva lexikonet.