Digitalisering av ett urval av äldre svenska dagstidningar
Modern digital teknik har fört utvecklingen framåt. Genom att konvertera den digitala bilden till maskinläsbar text (OCR-tolkning) möjliggörs fritextsökningar, vilket underlättar för den som söker svar på specifika frågor och öppnar för helt nya typer av undersökningar.
KB och Riksarkivet har sedan 2010 byggt upp en produktionslinje för massdigitalisering av dagspress och KB har konstruerat ett gränssnitt för materialet. Nu pågår arbetet med att fylla gränssnittet, en verksamhet som kan följas på .
För att nyttiggöra denna struktur är det nödvändigt att få ut material direkt till forskningen över nätet. KB:s nuvarande budgetramar medger endast digitalisering av de löpande inkomna pliktleveranserna. Samtidigt kolliderar forskarsamhällets behov av fritt tillgängligt material med upphovsrättens begränsningar.
Detta projekt syftar till digitalisering av ett strategiskt urval dagstidningar för en period då materialet är upphovsrättsligt fritt. På så sätt kommer forskningsinfrasfrukturen att kunna substantiellt förbättras trots de tvingande begränsningarna.
1.1. Digitalisering av ett urval av äldre svenska dagstidningar IN15-0452:1 Slutrapport
Bakgrund
Dagstidningarna har i två sekler setts som garanter för demokrati och fritt meningsutbyte och de är centrala informationskällor för forskare inom humanistiska och samhällsvetenskapliga forskningsområden.
Dagstidningar har vanligtvis producerats utan höga krav på hållbarhet, papperet de trycks på har ofta låg beständighet. För att bevara informationen för framtiden har dagspressen mikrofilmats sedan 1950-talet, en lösning som innebär en avsevärd bevarandepotential men som inte underlättar sökmöjligheter och användande av materialet.
Den digitala tekniken har radikalt förändrat förutsättningarna. Genom att konvertera den digitala bilden till maskinläsbar text (OCR-tolkning) möjliggörs fritextsökningar, vilket underlättar för den som söker efter specifik information och öppnar för helt nya forskningsstrategier.
Kungliga biblioteket (KB) och Riksarkivet (RA) har sedan 2010 byggt upp en produktionslinje för massdigitalisering av dagspress och KB har utvecklat ett gränssnitt för tillgängliggörande av de digitala samlingarna. KB:s budgetramar medger endast digitalisering av de löpande inkomna pliktleveranserna. Den retrospektiva digitaliseringen av KB:s dagstidningssamlingar har genomförts med extern finansiering.
Sammanfattning av projektet
Det här redovisade projektet har fokuserat på digitalisering av ett strategiskt urval dagstidningar för en period då materialet är upphovsrättsligt fritt. Projektet har därmed som syfte att ge digital tillgång till dagspress utan upphovrättsmässiga begränsningar.
KB har erhållit ett anslag på 10 414 268 kr, som ska täcka digitalisering av 44 tidningstitlar för perioden 1645-1895.
Den ursprungliga uppskattningen av samlingens omfång var cirka 1 200 000 sidor. Detta visade sig emellertid vara en underskattning och den exakta siffran blev till slut 1 395 102 sidor.
Digitaliseringsarbetet utfördes av RA/MKC i Fränsta och pågick fram till och med december 2017. Vid en genomgång i slutet av december 2017 visade det sig att fem årgångar ej hade blivit digitaliserade (Post- och inrikes tidningar samt Norrköpings tidningar, totalt 7 848 sidor). Dessa digitaliserades under februari 2018 och är inkluderade i det slutgiltiga sidantalet i stycket ovan.
Det tidningsmaterial vi har arbetat med har varit av varierande tillstånd: från stabil till omfattande nedbrytning. Det slutgiltiga genomsnittliga sidpriset landade på 7,14 kronor.
1.2. Preparering, registrering och leverans av tidningar på Kungl- biblioteket
Sedan projektstarten i januari 2016 har 1 395 102 sidor preparerats, registrerats och levererats till RA/MKC.
Digitaliseringen utgick ifrån KB:s reservexemplar i den mån sådana fanns att tillgå. Fanns inte reservexemplar så digitaliserades KB:s nationalexemplar. Cirka 85 % av de digitaliserade tidningarna var reservexemplar.
Under projektets första tid var arbetet med att hitta exemplar i KB:s arkiv tämligen tidsödande. Under maj 2016 initierades dock ett projekt med att registrera placering och period för KB:s samtliga tidningsbuntar i Statens biblioteksdepå, där alla tidningar från 1851 och framåt finns arkiverade. Det projektet är nyligen klart och det underlättade storligen den senare delen av projektet och kommer även att så göra i framtida digitaliseringsprojekt.
1.3. Tillgängliggörande av de digitaliserade tidningarna i KB:s visningstjänst tidningar.kb.se
Tidningarna tillgängliggjordes löpande på tidningar.kb.se allteftersom de blev digitaliserade och arkiverade. Alla tidningssidor finns nu sökbara i tjänsten och det rör sig de om de i bilaga redovisade titlar.[1]
1.4. Hur har projektet presenterats?
Projektet och dess framåtskridande har presenterats på Kungliga bibliotekets hemsida, Twitter, Facebook och Mynewsdesk vid ett flertal tillfällen.[2][3][4] Artiklar om projektet och dagstidningsdigitalisering har publicerats i Biblioteksbladet 2017[5] och i Släkthistoriskt forum 2017[6][7][8]. Sveriges släktforskarförbund har dessutom kontinuerligt uppdaterat sin hemsida med nyheter kring projektet.[9][10][11] Pressutskick till utvalda tidningar och andra intressenter har också skett vid två tillfällen.
Utvecklingen i projektet uppdateras löpande i tidningstjänstens användarforum.[12] Intresset för projektet kan också spåras i tidningstjänstens externa besöksstatistik som har gått från ett snitt på 150 användare per dygn vid projektets start till över 500 unika användare per dygn i dagsläget.
Tidningsenhetens medarbetare lägger mycket tid på att upplysa om projektet i olika sammanhang. Under 2017 genomfördes större presentationer av projektet på Släktforskardagarna i Halmstad [13] och på Bokmässan i Göteborg.
1.5. Har projektet resulterad i nya forskningssamarbeten eller nya forskningsuppgifter?
Det finns flera exempel på forskning där det upphovsrättsfria tidningsmaterialet används som grunddata.
Humlab, vid Umeå Universitet, har använt sig av de upphovsrättsfria svenska dagstidningarna från ”data.kb.se” i sitt projekt ”Digital lägg – om pressens gränssnitt 1800”.[14]
Ekonomiforskarna Hanna Stenbacka Köhler och Isaiah Hull från Riksbanken och Hanna Armelius på Finansdepartementet har använt "tidningar.kb.se" i sitt arbete med att konstruera ett osäkerhetsindex.[15][16]
Det kan också konstateras att antalet besökare vid dagstidningsterminalerna i KB:s mikrofilmsläsesal i Humlegården har stigit kraftigt samtidigt som antalet frågor via mail, telefon och sociala medier också har ökat betydligt allteftersom projektet har fortskridit.
Från och med januari 2018 har även Sveriges samtliga universitets- och högskolebibliotek möjligheten att visa allt innehåll i tidningar.kb.se för sina forskare och studenter. Hittills har 16 bibliotek anslutit sig.[17]
Detta är resultatet av det avtal som KB slöt med Bonus Copyright Access under sensommaren 2017, ett avtal som sträcker sig fram till och med 2019-06-30.
KB har också inlett ett samarbete med Språkbanken vid Göteborgs universitet kring tekniska lösningar för att förbättra resultaten vid OCR-tolkning.
Samtliga filer som producerats i projektet fram till och med 2017-12-31 har levererats till Språkbanken och införlivats i deras textkorpus.
1.6. Ekonomisk redovisning 2016-01-01-2018-03-31
KB har erhållit ett anslag på 10 414 268 kr, som ska täcka digitalisering av cirka 45 tidningstitlar för perioden 1645-1895.
Vi uppskattade ursprungligen samlingen till cirka 1 200 000 sidor. Detta visade sig emellertid vara en underskattning och den exakta siffran blev till slut 1 395 102 sidor.
Själva digitaliseringsarbetet utfördes av RA/MKC i Fränsta och pågick fram till och med december 2017. Vid en genomgång i slutet av december 2017 visade det sig att sammanlagt fem årgångar ej hade blivit digitaliserade. Det rör sig om titlarna Post- och inrikes tidningar samt Norrköpings tidningar och är inalles 7 848 sidor. Detta meddelades till fonden per e-post den 5 februari 2018. Dessa digitaliserades februari och mar 2018 och är inkluderade i det slutgiltiga sidantalet i stycket ovan.
Tillståndet hos det tidningsmaterial vi har arbetat med har varierat avsevärt vilket också påverkat kostnadsbilden. Det slutgiltiga genomsnittliga sidpriset hamnade på 7,14 kronor.
Kostnaden för arbetet som lades ner på MKC fördelas enligt följande:
2016 2 594 687 kr
2017 7 314 077 kr
2018 (resterande 5 årg.) 48 951 kr
Tot. 9 957 715 kr
Av beviljade medel har Kungliga biblioteket via rekvisition begärt ut 10 400 000 kr. Av dessa har alltså 9 957 715 kr använts och kvar av rekvirerade medel återstår 442 285 kr. Dessa kommer att återlämnas till fonden. Kungliga biblioteket behöver därför information om till vilken bank och vilket kontonummer dessa medel skall överföras.
1.7. Hur integreras arbetet i organisationen? Hur kommer det att vidareföras?
Bidraget från Riksbankens Jubileumsfond till detta projekt har avsevärt stärkt tillgången till historiska dagstidningar. En betydande del av Sveriges äldsta dagstidningar kommer efter projektet att vara tillgängliga för forskningen och allmänheten.
Digitaliseringen av dagstidningar är i dag en central del av vår verksamhet, tyvärr rymmer inte Kungliga bibliotekets budget löpande medel för digitalisering av de historiska samlingarna. För att kunna göra detta behöver vi fortsatt stöd och vi söker därför kontinuerligt bidragsgivare och samarbetspartners som kan möjliggöra detta. Digitaliseringen innebär att forskare och den intresserade allmänheten får tillgång till ett historiskt källmaterial som speglar samhällets utveckling och förändring. Digital tillgänglighet medför således även demokratiska vinster.
Det finns ett stort intresse för detta material och speciellt för dagspressen från det lokala Sverige, de delar av landet som ofta hamnar i skuggan av storstadsregionerna.
Det är också allt mer tydligt att det på medieområdet sker en koncentration kring de större städerna och storstäderna, parallellt med avfolkningen av landsbygden, vilket också belyser vikten av att digitalisera det historiska och regionala samlingarna. Vårt mål är att efter detta projekt söka medel för att kunna digitalisera den resterande delen av de äldsta tidningssamlingarna.
1.8. Projektrapportering från KB till Riksbankens Jubileumsfond
• Halvårsrapport: 2016-06-13
• Ettårsrapport: 2017-01-23
• Artonmånadersrapport: 2017-07-10
• Följebrev till delredovisning: 2017-07-12
• Revisionsrapport: 2017-07-21 (lämnad i portal)
• Resultat av en efterkontroll i IN15-0452:1: 2018-02-05
• Digitalisering av ett urval av äldre svenska dagstidningar IN15-0452: Slutrapport: 2018-04-24
Torsten Johansson
Newspaper Division
National Library of Sweden
+46 10 7093402
torsten.johansson@kb.se
Referenser
1. Se bilaga ”RJ, titlar”
2. http://www.kb.se/aktuellt/nyheter/2016/Slaktforska-och-folj-1800-talets-nyhetsrapportering--KBs-soktjanst-for-dagstidningar-vaxer/
3. http://www.kb.se/aktuellt/nyheter/2017/Annu-mer-historiska-nyheter-i-KBs-onlinetjanst2/
4. http://www.kb.se/aktuellt/nyheter/2017/En-miljon-fria-tidningssidor-i-KBs-soktjanst/
5. http://biblioteksbladet.se/skatten-i-kallarhalan/
6. Svensson, Hanna; ”En skattkista för tidningsälskare”; Släkthistoriskt forum; nr 1, 2017, s 18-21. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
7. Lindström, Christer; ”Tidningarna gav svar på sekelgammal gåta”; Släkthistoriskt forum; nr 1, 2017, s 22. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
8. Söderström; Olle och Svensson, Hanna; ”Upphovsrätt bakom tidningstrasslet”; Släkthistoriskt forum; nr 1, 2017, s 23. https://www.genealogi.se/images/shf/SHF-1-17-digitaliserade%20dagstidningar.pdf
9. https://www.genealogi.se/om-roetter/nyhetsarkivet/nyheter-2017/123-nyheter/2013/1792-soek-och-finn-bland-hundratusentals-tidningssidor
10. https://www.genealogi.se/123-nyheter/2013/1874-en-miljon-fria-tidningssidor-digitaliserade-hos-kb
11. https://www.genealogi.se/123-nyheter/2013/1900-nya-tidningssidor-i-kb-s-digitala-tjaenst
12. http://feedback.tidningar.kb.se/viewtopic.php?id=84
13. http://www.sfd2017.se/program/massprogram-och-tider/digitalisering-av-historiska-dagstidningar-pa-kungliga-biblioteket
14. http://www.humlab.umu.se/sv/forskning-utveckling/paagaaende-projekt/digitala-laegg/
15. http://www.policyuncertainty.com/sweden_monthly.html
16. http://www.sciencedirect.com/science/article/pii/S016517651730109X?via%3Dihub
17. http://feedback.tidningar.kb.se/viewtopic.php?id=113
Bilaga
RJ, titlar
Titel: Antal nr. antal sidor År fr.o.m. År t.o.m.
ALFWAR OCH SKÄMT 158 670 1842 1843
BAROMETERN 7 430 29 650 1841 1895
BORÅS TIDNING 6 048 24 559 1839 1895
CARLSCRONAS TIDNINGAR 108 436 1761 1764
CARLSCRONAS WEKOBLAD 9 860 40 637 1754 1878
DAGLIGT ALLEHANDA 24 445 161 651 1767 1849
FALKÖPINGS TIDNING 3 670 14 638 1857 1896
GÖTEBORGS HANDELS- OCH SJÖFARTSTIDNING 18 042 83 845 1832 1895
GÖTEBORGSPOSTEN 11 151 46 833 1859 1895
GÖTHEBORGS ALLEHANDA 9 192 38 305 1774 1843
GÖTHEBORGSKA NYHETER 4 349 35 790 1765 1848
HÄRNÖSANDSPOSTEN 6 682 25 788 1842 1895
INRIKES TIDNINGAR 7 399 36 154 1760 1820
JÖNKÖPINGSPOSTEN 3 579 16 075 1865 1895
KARLSHAMNS ALLEHANDA 5 935 22 481 1848 1896
KARLSKRONA WECKOBLAD 2 588 11 109 1879 1895
KRISTIANSTADSBLADET 6 408 25 596 1856 1895
LUNDS WECKOBLAD 8 222 37 257 1775 1897
MALMÖ ALLEHANDA 6 724 27 778 1827 1893
NERIKES ALLEHANDA 6 800 27 520 1844 1895
NORDEN 279 1 326 1856 1861
NORRBOTTENSKURIREN 2 735 11 128 1861 1896
NORRBOTTENSPOSTEN 2 926 11 778 1847 1895
NORRKÖPINGS TIDNINGAR 16 194 69 183 1787 1895
NORRKÖPINGS WECKOTIDNINGAR 1 206 5 522 1758 1786
NORRLÄNDSKA KORRESPONDENTEN 2 432 9 616 1851 1873
NYA DAGLIGT ALLEHANDA 10 971 46 173 1859 1895
NYA KARLSKRONA WECKOBLAD 51 218 1878 1878
NYA WERMLANDSTIDNINGEN 5 287 22 011 1851 1895
NYA WEXJÖBLADET 4 847 20 051 1847 1895
NYTT ALLVAR OCH SKÄMT 445 1 786 1844 1851
NYTT OCH GAMMALT 1 533 13 724 1783 1812
POST- OCH INRIKES TIDNINGAR 21 057 104 446 1821 1895
POSTTIDNINGAR 12 243 62 886 1645 1820
STOCKHOLMS DAGBLAD 22 405 118 683 1824 1895
STOCKHOLMSPOSTEN 16 425 66 005 1778 1833
SUNDSVALLS TIDNING 2 658 10 889 1880 1895
SUNDSVALLS TIDNING NORRLÄNDSKA KORRESPONDENTEN 917 3 740 1873 1879
UMEBLADET 3 431 14 114 1847 1896
UPSALA 6 284 27 061 1845 1895
WERMLANDSTIDNINGEN 395 1 574 1844 1850
VESTMANLANDS LÄNS TIDNING 5 951 24 066 1831 1896
WEXJÖBLADET 2 348 9 580 1810 1855
ÖSTGÖTA CORRESPONDENTEN 7 933 32 770 1838 1895
Totalt 299 743 1 395 102