English version of this page

Autotekst: KI-drevet automatisk teksting på norsk

Visste du at IT-avdelingen på UiO har utviklet et av de beste verktøyene for automatisk teksting på norsk? Her får du omformet tale til tekst, enten det er et intervju du har tatt opp du vil ha i tekstform, eller om det er undervisningsvideo du må ha tekstet for å oppfylle lovkravet om universell tilgjengelighet.

Akkurat det vi trenger

Automatisk teksting på norsk har lenge vært vanskelig, og både UiO og andre har prøvd på dette tidligere. Det som ligger til grunn for at vi nå har et verktøy som klarer jobben svært godt, og som til og med kan transkribere norske dialekter, er den hurtige utviklingen innenfor kunstig intelligens (KI/AI). IT-avdelingen på UiO har utviklet verktøyet Autotekst, som drives av KI.

OpenAI hadde løsningen

OpenAi tjenesten Whisper. Dette er programvare som er basert på AI-modeller som kan kjøre på lokale servere. Utfordringen er at tjenesten krever veldig mye datakraft. Heldigvis har IT-avdelingen på UiO akkurat det – altså mye datakraft – så nå går verktøyet Whisper på vår egen infrastruktur uten at noe data forlater campus og UiOs servere.

Jakten på god automatisk teksting

– For to år siden utviklet vi Autotekst for å gjøre det enklere tekste video. Det er et krav at alle forelesningsvideoer på uio.no skal være tekstet, og siden kravet trådte i kraft, har vi jobbet hardt for å komme fram til en teknisk løsning for god automatisk teksting, forteller seksjonssjef for webutvikling på UiO, Dagfinn Bergsager. – Teksting har vært svært tidkrevende, så det har vært viktig å finne en løsning som krever minst mulig manuell teksting. Og nå har vi det! Autotekst fungerer svært godt på norsk tale, til og med når den som snakker har dialekt!

Stor interesse i sektoren

IT-avdelingen på UiO utvikler en rekke IT-tjenester som ikke bare brukes på UiO, men også av andre i sektoren. Da det ble klart at Autotekst oppnådde automatisk høykvalitetsteksting av norsk tale i tillegg til en rekke andre språk, kom gladmeldingen om at UiO også tilbyr tjenesten til andre i UH-sektoren og offentlig sektor i Norge. Faktisk automatisk teksting gir store innsparinger sammenlignet med det man hadde tidligere. I juni hadde 17 institusjoner bestilt Autotekst, blant dem er en rekke universiteter og høyskoler, samt Utdanningsetaten i Oslo kommune, Helsedirektoratet og Direktoratet for høyere utdanning og kompetanse. Nå kan Autotekst også brukes av institusjoner uten FEIDE-pålogging, så listen over brukere blir raskt lenger.

Se en kort video om Autotekst og hvordan du kan ta den i bruk. 

Videoen er kun på 1 minutt og 54 sekunder, så dette har du tid til :)

Autotekst var tidlig ute, men nå gjør KI verktøyet mye bedre

Autotekst, da den ble lansert, tok imot lyddata, sendte dem til Googles tjeneste Speech-to-Text og returnerte tekst. Problemet var at kvalitet på transkribering av norsk tale var veldig lav, og krevde mye etterarbeid. – Vi beregnet kostnaden til å renskrive teksting til alle forelesningsvideoer som publiseres på uio.no til 20 millioner kroner i året! I tillegg hadde vi personvernutfordringer med å sende data ut av Norge hver gang vi skulle transkribere, fortsetter Bergsager.

Men nå, når Autotekst bruker Whisper-teknologien fra OpenAI, og kun kjører på våre egne UiO-servere, fungerer det mye bedre. Autotekst, slik den er nå, krever vesentlig mindre etterarbeid og i mange tilfeller kan teksting legges ut uten å bli renskrevet i ettertid. Slik kan alle som må tekste video eller transkribere lyd, spare mye tid og ressurser.

Skjermbilde av Autotekst
Alle deler av autotekst.uio.no kjører på UiOs servere. Marker bildet for større versjon.

 

Mer om Autotekst

Publisert 20. juni 2023 12:45 - Sist endret 27. juni 2023 10:15