Nye publikasjoner om talegjenkjenningsteknologi

Å kunne skrive med stemmen eller få digitale møter tekstet i sanntid, kan hjelpe mange med ulike funksjonsnedsettelser. Hva er status for tale-til-tekst-teknologi for norske språk? Med støtte fra Bufdirs tilskuddsordning har vi laget både en kunnskapsinnsamling om temaet og en steg-for-steg-guide til en del produkter med taletranskribering.

Taleteknologi er en gren innen kunstig intelligens som har skutt fart de siste årene.  Direkte taletranskribering vil kunne hjelpe hørselshemmede i digitale møter og konsultasjoner hvis transkriberingen er god nok. Automatisk transkribering vil også kunne erstatte skrivetolker og tegnspråktolker når kvaliteten er tilfredsstillende.  

Talegjenkjenning er også et verktøy for personer som har problemer med å bruke vanlig tastatur og mus. Denne gruppen kan bruke talegjenkjenning for å kunne styre datamaskinen eller mobiltelefonen og for å diktere tekst ved hjelp av stemmen. Dyslektikere og andre med skrivevansker samt synshemmede kan bruke tale-til-tekst-teknologi for diktering.

 

Det er også knyttet forventning til enklere tilgang til referatskriving, journaler, teksting av videoer, direkte TV-sendinger mv. Det er uten tvil stor nytte for mange å ha tilgang på god tale-til-tekst-teknologi. Men hvor god er teknologien egentlig? 

 

Dette var bakgrunnen for prosjektet «Tale-til-tekst (3T)» som vi har gjennomført sammen med Hørselshemmedes landsforbund (HLF) i 2022.

 

Steg-for-steg-guide

I prosjektets første del testet vi en del løsninger med tale-til-tekst-teknologi selv og sammen med hørselshemmede. Dessverre viste disse testene at de ikke er gode nok til å fungere i de situasjonene hvor hørselshemmede har mest problemer med å høre. Dette er når mange snakker samtidig eller det er mye bakgrunnsstøy. Løsningene vi undersøkte hadde også problemer med å få tall og forkortinger riktige.

Det er likevel situasjoner hvor tale-til-tekst-teknologi kan være nyttig, også for hørselshemmede. For eksempel i apper hvor man kan lese inn på norsk og får det oversatt til et annet språk eller søk på nettet med stemmen. Vi laget en steg-for-steg-guide hvordan man kan bruke transkriberingsfunksjonen i en del programmer. Guiden er publisert på HLFs nettsider.

 

Fungerer best ved diktering til bokmål

Etter å ha konsultert en rekke fagpersoner og gjennomgått tilgjengelig informasjon om temaet kan vi kort oppsummert si at taletranskribering i form av diktering med standard østnorsk talemål til bokmål fungerer greit og er tilgjengelig i flere apper og programmer i 2022. Egennavn, tall, forkortelser og faguttrykk er likevel vanskelig å få korrekt.

 

Har man et system som er knyttet til et spesifikt fagområde og en språkmodell trenet spesielt på området, fungerer det bedre enn hvis det benyttes en generell språkmodell. Transkribering av naturlig, spontan samtale fungerer dårlig.

 

Diktering til nynorsk finnes, men har lavere kvalitet enn bokmål og er kun tilgjengelig i ett kommersielt produkt. Nynorsk finnes verken i Apple-, Microsoft- eller Google-produkter eller annen hverdagslig teknologi. Det er stort behov for mer taledata med ulike type stemmer og dialekter. Dette gjelder både nynorsk og bokmål. Det er ennå ikke utviklet noen teknologi for transkribering av tegnspråk eller noen av de samiske språkene. 

 

Dagens tale-til-tekst-teknologi er ikke på et nivå hvor det kan erstatte skrivetolker for personer med nedsatt hørsel. Dessverre er ikke den lett tilgjengelige teknologien så presis at hørselhemmede er gruppen som vil ha mest glede av den. Blinde, dyslektikere eller personer som har problemer med å bruke tastatur kan ha stor nytte av teknologien slik den er i dag, så lenge man ønsker å diktere til bokmål. Mange uten funksjonsnedsettelse vil også kunne ha glede av teknologien da den frigjør fingre, og det går mye raskere å diktere enn å bruke tastatur.

 

Tale-til-tekst-teknologi er et steg i retning av et mer universelt utformet samfunn, men teknologien er i dag ikke god nok til at den fungerer for alle.

 

Kunnskapsinnsamlingen finner du på våre nettsider som PDF-fil 0,5 MB

0

Skriv en kommentar

hCaptcha