De Deutsche Nationalbibliothek
NOS Nieuws

Deutsche Nationalbibliothek gaat alle Duitstalige tweets archiveren

  • Joey Frankhuisen

    redacteur Bureau Berlijn

  • Joey Frankhuisen

    redacteur Bureau Berlijn

Politieke discussies, nepnieuws van trollen en de weekendplannen van beroemdheden; sinds de lancering van Twitter in 2006 plaatsten Duitsers ruim vier miljard tweets op het online platform. Omdat de toekomst van Twitter sinds de overname van Elon Musk enigszins onzeker is, heeft de Nationale Bibliotheek van Duitsland, de Deutsche Nationalbibliothek, besloten om alle Duitstalige tweets te archiveren.

Heeft het wel zin om alle tweets te downloaden als er zo veel onzin tussen zit? Volgens co-projectleider Claus-Michael Schlesinger, onderzoeker aan de Humboldtuniversiteit in Berlijn, is het project wel degelijk van belang. "Twitter is een belangrijke vorm van communicatie voor de samenleving. Om in de toekomst inzicht te hebben in hoe het er in deze tijd in Duitsland aan toeging, is het belangrijk dat deze tweets toegankelijk zijn."

Als een auteur van nu over honderd jaar beroemd is, kunnen de tweets onderdeel zijn van zijn of haar werk.

Claus-Michael Schlesinger, onderzoeker

Het project is een samenwerking met het Science Datacenter for Literature en heeft twee doelen. Schlesinger: "Ten eerste weten we niet welke Duitsers in de toekomst van historisch belang zullen zijn. Als een auteur van nu over honderd jaar beroemd is, kunnen de tweets onderdeel zijn van zijn of haar werk. Als Twitter tegen die tijd niet meer bestaat, kunnen geïnteresseerden naar de Nationale Bibliotheek gaan om deze tweets in te zien."

De tweede en belangrijkste reden heeft te maken met de toekomstige ontwikkelingen rond de zogeheten Application Programming Interface (API), een functie die het mogelijk maakt om in een keer grote aantallen tweets te analyseren. Onderzoekers maken hier bijvoorbeeld gebruik van bij data analyses.

Onlangs werd aangekondigd dat toegang tot deze functie in de toekomst geld zal gaan kosten. Schlesinger: "Het lijkt erop dat deze toegang onbetaalbaar wordt voor veel onderzoekers die deze dienst gebruiken en het is niet ondenkbaar dat deze functie in de toekomst helemaal zal verdwijnen. Dit maakt onafhankelijk onderzoek in veel gevallen onmogelijk."

Om dit enorme aantal tweets te downloaden, vraagt de Nationale Bibliotheek onderzoekers met toegang tot de API om zich aan te melden als vrijwilliger. Zij kunnen hun toegang tot de API ter beschikking stellen of zelf de tweets downloaden. Tweets kunnen in batches van een miljoen gedownload worden en een onderzoeker kan per maand maximaal tien miljoen tweets downloaden.

Hoelang het project precies zal duren en of het überhaupt mogelijk is om het project af te maken, is niet duidelijk. Schlesinger: "Het project loopt inmiddels vier weken en tot nu toe hebben we 160 miljoen tweets gedownload. We verwachten dat er over dertig dagen veranderingen in de toegankelijkheid tot de API zullen plaatsvinden. Momenteel weten we niet of er een vergelijkbare functie voor in de plaats komt. We hopen op het beste."

Unieke functie

Dat de Deutsche Nationalbibliothek het op zich neemt om de vier miljard tweets te archiveren is geen toeval. De bibliotheek is namelijk de centrale archiefbibliotheek van Duitsland en verzamelt sinds de oprichting in 1913 alle publicaties in schrift, beeld en geluid die over Duitsland of in de Duitse taal verschijnen.

Deel artikel:

Advertentie via Ster.nl