Livsminnesamlingen transkribert

Bilde generert i forbindelse med Nasjonalbibliotekets lansering av NB Whisper i februar 2024.
Bilde generert i forbindelse med Nasjonalbibliotekets lansering av NB Whisper i februar 2024.
Flere hundre timer med opptak av skeive historier, er endelig på papiret. Nasjonalbiblioteket har utviklet KI-verktøy som forstår norsk.  Dette åpner også for andre store KI-muligheter. 

Nasjonalbiblioteket har lansert NB-Whisper, en språkmodell som gjør lyden av norsk tale om til skrift. Dette har Skeivt arkiv ventet på.  

En talegjenkjenningsmodell utviklet av OpenAI er blitt “trent” på et stort datasett av norsk tale, kombinert med tilsvarende skriftlige transkripsjoner, noe som gjør den i stand til å transkribere norsk tale til tekst.  

Livsminnesamlingen er en av juvelene i arkivets samlinger. Over 230 mennesker har de siste årene satt seg ned foran vårt kamera for å fortelle om sine skeive liv. Men den store samlingen av opptak har ikke vært like lett å lete i. Hvem forteller om hva? Og på hvilket tidspunkt og i hvilken video?  

Se biter fra Livsminnesamlingen i Skeivt arkivs spilleliste på Youtube. 

Mer tilgjengelig 

Manuell transkribering er svært tidkrevende. Skeivt arkiv har derfor ventet med transkribering av fortellingene i påvente av nye verktøy.  
Maskinell transkribering har eksistert en stund, men med avskrifter fulle av feil. Dessuten har tjenestene vært plassert “i skyen”. Nasjonalbibliotekets nye modell er derfor svært velkommen og etterlengtet. 

Nå har vi endelig transkripsjoner, ord for ord, fortelling for fortelling takket være NB-Whisper. Samlingen intervjuer er levendegjort og tilgjengeliggjort på en helt ny og spennende måte.  

Se Nasjonalbibliotekets lansering av NB-Whisper i februar 2024. 

Beskyttet materiale 

Personene i samlingen har ofte fortalt svært private historier. Livsminnesamlingen er derfor særlig beskyttet, og kan kun bli sett på ved oppmøte i Skeivt arkivs lokaler i Bergen. Det er viktig å presisere at transkriberingene har skjedd lokalt på en av arkivets datamaskiner, og er ikke delt med noen andre.  

Norskopplæringen 

NB-Whisper bygger på KI-giganten Open AIs verktøy Whisper som gjør tale om til tekst. Nasjonalbibliotekets store bidrag har vært å “trene” Whisper på tusenvis av timer med norsk transkribert tale. Materialet er funnet blant annet i Stortinget og hos NRK. Opptak fra Stortingets talerstol er blitt transkribert i flere år, og NRK har tekstet tusenvis av timer med programmer på norsk. Dette enorme materialet har gitt NB-Whisper  bred forståelse av norsk, inkludert et spekter av dialekter. 

Nasjonalbibliotekets NB-Whisper er en talegjenkjenningsmodell som de fleste av oss ikke kan bruke uten videre. VG har derfor laget en app for sine journalister som gjør NB-Whisper både tilgjengelig og brukervennlig. Denne er gratis for alle som bruker Mac. Du finner appen “JoJo” i Appstore. Skeivt arkiv har transkribert sine opptak ved hjelp av denne appen. 

Erfaringer 

NB-Whisper er den beste modellen som finnes for transkribering av norsk tale. Forståelsen av dialekter er god, men noen dialekter kan likevel være litt vanskelige. Bakgrunnsstøy, usammenhengende eller utydelig tale kan gi feil i transkripsjonen. Utenlandsk aksent kan også skape litt flere feil i den skrevne teksten. 

Teksten er likevel av en så høy kvalitet at vi kan med en gang bruke den til å søke med stikkord på f.eks. hendelser, navn og steder og få gode resultater.  

De aller fleste intervjuene trenger vi bare gå raskt gjennom for å rette opp enkelte feil her og der. (Dette arbeidet gjøres også lokalt på maskinen med gratis-verktøyet oTranscribe.) 

Snakke med et arkiv? 

Kunstig intelligens har altså gjort maskinell transkripsjon mulig. Utviklingen går utrolig fort. I tiden framover vil KI skape helt nye muligheter for alle som arbeider med arkiver. 

Vi ser noen muligheter, men regner med å bli overrasket over andre. Skeivt arkiv ønsker å følge tett med på hvordan dette feltet utvikler seg.  

Vi er i ferd med å teste små språkmodeller som gjør det mulig å snakke med Livsminnesamlingen på en helt ny måte. Dette skal gi andre og mer fullstendige svar enn dagens søk på stikkord. 

Vi har også en stor samling skeive tidsskrifter fra de siste 70 årene. Hva om vi gjør det samme med dem? Hva med resten av arkivmaterialet?  Hva om vi kan snakke med arkivets innhold og finne fram til relevant kildemateriale på noen øyeblikk? En forutsetning er naturligvis at vi tar vare på krav til klausulering, beskyttelse av personvern og andre hensyn til sensitivitet. 

Nasjonalbibliotekets transkripsjonsverktøy kan vise seg å være bare begynnelsen på en spennende utvikling for arkivet. Hold på hatten.