Kungliga biblioteket lanserar AI som transkriberar tal

Kungliga biblioteket, KB, kommer att använda KB-Whisper för att transkribera sitt stora radioarkiv.
Foto: KB/Lina Löfström Baker.
Kungliga biblioteket introducerar tal-till-text-modellen KB-Whisper, som har tränats i över 50 000 timmar på tv, riksdagstal och en massa svenska dialekter.
    Modellen bygger på OpenAI:s tal-till-text-modell Whisper men man har använts sig av material från Sverige för att transkribera svenskt tal till text. Tester visar att den gör 47 procent färre ordfel än sin amerikanska motsvarighet.

– Det här är en milstolpe för taligenkänning på svenska, säger Leonora Vesterbacka, senior dataforskare på KB.

KB-Whisper är gratis och kan laddas ned från KB:s sida på plattformen Huggingface.
    KB: Vältränad AI-modell förvandlar svenskt tal till text.
    HuggingFace: National Library of Sweden / KBLab.

Det här inlägget postades i Data, Internet, Geografi, Historia, IT, Kultur, Ljud, Politik, myndigheter, Samhällsservice, Språk. Bokmärk permalänken.