Historie

Historikere har gjort 370.000 sider fra enevældens aviser søgbare: ”De er en guldgrube”

På Aalborg Universitet har et hold historikere nærlæst og transkriberet tusindvis af 200-300 år gamle artikler for at træne kunstig intelligens til at søge i dem

De er ikke nødvendigvis i særligt god og læsbar stand, og som de ligger digitalt hos Det Kongelige Bibliotek, er succesraten omkring 50 procent, når man skal søge i dem.

Men med et nyt værktøj udviklet af en gruppe historikere på Aalborg Universitet er det nu blevet muligt at søge i Enevældens Aviser, efter at de har trænet det europæiske transskriberingsværktøj Transkribus på tusindvis af gamle avisord.

Altså de aviser, der blev udgivet i Danmark og Norge fra 1749 frem til starten af 1800-tallet.

”Aviserne er en guldgrube,” siger Johan Heinsen, professor i historie på Aalborg Universitet, og den primære drivkraft i udviklingen af søgeværktøjet, der bygger på kunstig intelligens.

”De er et hverdagsmedie. De fortæller om storpolitik. Om Napoleons marcher. Men også hvor man kan købe citroner på markedet. Hvor der er en tjeneste som malkepige at få. De fortæller om nær og fjern på tværs af samfundet. Også til grupper, der ikke læste, men hvor vi må formode, at der var en mundtlig overlevering,” siger han.

Aviserne er på den måde en vigtig indgang til at forstå, hvordan man tænkte under enevælden, hvordan livet blev levet, og hvad man vidste.

Søgemaskinen er blevet trænet på tusindvis af artikler, som Johan Heinsen og hans kolleger har nærlæst og transskriberet for at kunne træne den kunstige intelligens til at kunne genkende ord og bogstaver og at kunne dele teksten rigtigt op i forhold til spalter.

Det er artikler, eller tekster, som har ligget digitalt hos Det Kongelige Bibliotek i form af affotograferinger af de gamle avissider. Men fordi nogle af siderne er krøllede, har mugpletter eller blækken er blødt ud, har det med den gamle teknologi ikke været muligt at søge i dem.

Efterlysninger og lakse-annoncer

Og det er en skam, fordi aviserne rummer enormt meget information om, hvordan samfundet har udviklet sig.

”De er enormt vigtige. For eksempel siger de meget om, hvordan det frie arbejdsmarked udvikler sig. I den her periode er der tusindvis af annoncer, og der er enormt mange efterlysninger af tjenestefolk, der er løbet væk fra deres tjeneste,” siger Johan Heinsen.

For hans kollega, der forsker i, hvordan vi i Danmark har brugt maritime ressourcer gennem tiden, er der også gevinst ved at kunne søge i fiskerelateret indhold i de gamle aviser.

”Hun kan spore fiskemarkederne tilbage i tiden og se, hvornår man begynder at sælge røget laks som en delikatesse-vare,” siger Johan Heinsen.

Et socialt og politisk medie under censur

Og så har aviserne ifølge Johan Heinsen spillet en langt større rolle i kommunikationen mellem mennesker, end vi hidtil har troet. Og de er blevet læst – eller overleveret – på tværs af litterære lag.

Han peger på annoncer om bortløbne tjenestefolk, der er blevet efterlyst i avisen, fordi de er løbet afsted med husholdningens sølvskeer.

”Nogle gange ser man dem svare igen i avisen, at de ikke kommer tilbage, og at de ikke har taget de sølvskeer,” siger han og tilføjer:

”Det faktum, at de indrykker de annoncer, betyder, at den kommunikation når hele vejen igennem de samfundslag. Det er fascinerende, og det peger på, at aviserne har været vigtigere i forhold til kommunikation, end vi hidtil har troet. Og de har været mere et socialt medie, end vi har regnet med.”

Og så har de danske enevælde-aviser været meget mere opmærksomme på den store vide verden, end Johan Heinsen havde regnet med.

”De har et overraskende stort globalt udsyn. Man kunne læse om, hvad der skete med thehandlen i Kina. Hvor der var opstand i Vestindien,” fortæller han.

”På grund af censur under enevælden har man sagt, at der ikke står så meget om dansk politik. Men den måde, man har forstået dansk politik dengang, har været fortællinger om store politiske bølger: Hvor er der orden, og hvor er der uorden?”

En million sider bliver søgbare

Indtil videre er det 370.000 sider fra 1749 frem til starten af 1800-tallet, der er blevet gjort søgbare med Transkribus-værktøjet, der efter Johan Heinsen og hans kollegers træning af det kan genkende bogstaverne på avissiderne.

Når projektet er slut, er det mellem 800.000 og en million sider, der kan søges i.

Der er flere mål med projektet.

Dels håber man på Aalborg Universitet at kunne få bedre forskningsdata, hvor man ved, at man har fået de relevante artikler med. For ifølge Johan Heinsen er succesraten med det nye søgeværktøj omkring 97-98 procent.

Men de store tekstmængder på gammelt dansk giver også mulighed for at træne computeren til at kunne læse andre dokumenter som retsdokumenter.

”Det her er en trædesten til at kunne åbne arkiverne op,” siger Johan Heinsen.

Det er for nuværende muligt at søge i arkiverne, men med Johan Heinsens egne ord er det kun for ”de særligt nysgerrige”, da platformen stadig kun er en betaversion.

1 Kommentar

Nalle Peter Ben Kirkvåg
1. SEPTEMBER 2024
Sikke et fantastisk initiativ! Glæder mig til forhåbentlig en dag at dykke ned i alt den viden...