»Spriten är bra, men köttet är ruttet»Långt kvar innan tolkarna blir arbetslösa
(98-18)
<#Bild1#>
Om ett par år kan datorer simultantolka nyhetssändningar. Och redan idag är maskinöversättning ett användbart verktyg för vissa ändamål.
Maskinöversättning där där en dator översätter löpande text från ett språk till ett annat har länge ansetts som en viktig tillämpning. Mycket pengar och resurser har lagts ned på forskning, men resultaten har sällan eller aldrig motsvarat förväntningarna.
Det klassiska exemplet på misslyckad översättning är ju »the spirit is willing but the flesh is weak» som blir »spriten är bra, men köttet är ruttet».
Exemplet är antagligen konstruerat (åtminstone har jag inte hittat någon verklig referens), men illustrerar på ett bra sätt problemet: För att kunna översätta godtycklig text väl måste innehållet förstås, och för att förstå innehållet måste programmet ha samma erfarenhet och referensramar som en människa.
Men idag finns det faktiskt exempel på användbara tillämpningar för maskinöversättning. Det mest användbara är väl snabböversättning för att se om en text är intressant - om den är det anlitas en människa för att göra en bra och läsbar översättning.
Typexempel är sökningar i utländska patentdatabaser, sammanfattningar av rapporter samt websidor. Pröva till exempel babelfish.altavista.com för exempel på det sistnämnda.
I laboratorierna finns också direkt tal-till-tal översättning. Användaren säger en mening, exempelvis »vad kostar ett rum för två». Datorn tolkar talet till text, översätter texten samt läser den med en text-till-tal-algoritm.
De flesta praktiskt användbara system är idag baserade på statistiska modeller. Med andra ord förstår datorn inte innehållet utan använder en kombination av lexikalisk analys och sannolikhetsmodeller för att transformera ett språk till ett annat.
Begränsas ämnesområdet tillräckligt mycket - till exempel »servicemanualer för frontlastare» - går det att konstruera och lära upp system som verkligen förstår innehållet: Programmet läser originaltexten, tolkar om den till ett formellt semantiskt språk eller »Interlingua», samt genererar ny text utifrån meningen i Interlingua-språket.
Arbetet med att konstruera sådana system och få dem att fungera för det valda, mycket smala ämnesområdet är emellertid av sådan omfattning att det i dagsläget sällan lönar sig - annat än som forskningsprojekt.
Anledningen till att det överhuvudtaget går att praktiskt använda maskinöversättning är, utöver framsteg inom själva översättningstekniken, framförallt utvecklingen av integrerade kretsar: processorkraft och minne har blivit så pass billigt att man med våld kan betvinga problemet. Översättningsprogrammen kan pröva en lång rad olika varianter på varje mening mot stora databaser, för att på så vis få fram den mest sannolika.
Hur fungerar det då?
Ta som exempel översättning av tal från engelska till franska. Det första som händer är att talet transformeras till frekvensplanet och delas upp i spektralkomponenter. Komponenterna analyseras sedan med en gömd Markovmodell för att få fram fonerna, de minsta betydelsefulla delarna av talet. Markovmodellen har tränats för igenkänning på dels en stor databas med talexempel för språket och dels på den specifika användaren som utnyttjar systemet.
Fonerna omvandlas sedan till meningar med en kombination av ordmatchning, lexikalisk och syntaktisk analys som bygger på en stor databas över språket. Först slås fonsekvenserna upp och programmet får en lista med möjliga ord eller kombinationer av ord. Därefter försöker programmet med olika analyser och sannolikhetstabeller att skapa den mest sannolika meningen av ordförslagen.
Det viktigaste och svåraste steget är själva översättningen. Programmet har förhoppningsvis en syntaktiskt korrekt beskrivning av meningen som kan slås upp i en grammatisk databas. Databasen innehåller färdiga regler om hur olika konstruktioner ska skrivas - till exempel »deklarationer om djur i nutid» - som sammanställts genom att samköra stora mängder manuellt översatta texter med originalen.
Kan delar av eller hela meningen hittas i det separata i frasbiblioteket översätts direkt med motsvarigheten. Frasbiblioteket förbättrar kvaliteten avsevärt eftersom återkommande standarduttryck, ordspråk med mera kan översättas som en enhet.
Enskilda ord och ordkombinationer slås sedan upp i ordlistan. Även här används sannolikhetsmodeller för att hitta en mest sannolika av flera möjligheter, baserat på omgivande text.
Till sist det enklaste steget, högläsning av den översatta texten. Även de simplaste systemen idag ger förståeligt tal och de mest avancerade låter riktigt bra. Grunden är att slå upp orden i en tabell med ljudelement (fonem), som sedan eventuellt modifieras av meningstypen, exempelvis en fråga som ska ha stigande tonhöjd. Fonemen omvandlas sedan till ljud, antingen helt syntetiskt eller genom att använda en inläst röst.
Flera system som det beskrivna finns idag. Den stora nackdelen är att de bara fungerar med grammatiskt väldefinierad text som är indelad i kompletta meningar.
För att få en bra funktion i första delen - taltolkningen - måste systemet också tränas på den person vars röst ska förstås. Med en godtycklig person, till exempel en nyhetsuppläsare i radio, blir kvaliteten på taltolkningen relativt dålig. Kombinerat med de fel som översättningssteget gör blir slutresultatet under all kritik.
Det går alltså inte i dagsläget att få nyhetssändningar översatta med nöjaktig kvalitet. Däremot går det i många fall att ungefär begripa vad nyheterna handlar om.
Systemkraven är inte så farliga. De snabbaste persondatorerna idag klarar med ordentligt utbyggt minne att översätta tal i realtid.
Ett problem för oss med små språk som modersmål är att det kostar ganska mycket tid och pengar att bygga de databaser och sannolikhetsmodeller som krävs för att få både taltolkning och översättning att fungera.
Det gör att tillverkarna och forskarna ogärna tar fram de databaser som krävs för exempelvis svenska. Och det lär inte bli någon ändring innan tekniken är allmänt accepterad och levereras med varenda persondator.
Till drömmålet - att datorn fungerar som tolk mellan två människor som konverserar på olika språk - är det emellertid mycket långt kvar. Det lär inte bli möjligt förrän efter det går att föra en vettig konversation med själva datorn.
Bygg ditt eget översättningssystem
Vad vi vet finns inga färdiga system för direkt talöversättning i handeln. Men däremot finns alla komponenter som krävs för att bygga ett eget system: Taltolkning till text, översättning av text, samt uppläsning av te
Text : Ola Sigurdson
(19981112)
OSYSTEM