Luister naar

Bijna menselijk vertalen met een machine

Nieuws
Google Translate is al jaren de onbetwiste bron voor iedereen die snel een tekst wil vertalen. Maar concurrenten van de vertaaldienst komen met steeds betere vertaaltechnieken.
Pieter Beens rd
maandag 25 juni 2018 om 03:00
Statistische machinevertalingen leveren soms hilarische resultaten op en leiden vaak tot fouten als een vertaling weer wordt terugvertaald.
Statistische machinevertalingen leveren soms hilarische resultaten op en leiden vaak tot fouten als een vertaling weer wordt terugvertaald. anp / Piroschka van de Wouw

Apeldoorn

Een conferentie met Google, Amazon en Facebook als hoofdsponsors: die moet toch gaan over technologie, apps en de allernieuwste smartphones? Niets is minder waar. De drie technologiereuzen verbonden vorig jaar hun naam aan een conferentie over machinevertalingen.

Net als Apple, het Chinese Baidu en tal van kleinere bedrijven investeren ze grote bedragen in technologieën die teksten ‘automatisch’ vertalen. Hun doel: de techniek zo perfectioneren dat computervertalingen niet meer van menselijke vertalingen te onderscheiden zijn. Dat ideaal komt steeds dichterbij.

machinevertaling

Er zijn maar weinig consumenten die nog nooit Google Translate hebben gebruikt. De vertaaldienst bestaat al ruim tien jaar en vertaalt dagelijks meer dan 143 miljard woorden in zo’n 100 talen. Tot vorig jaar gebeurde dat via zogenaamde statistische machinevertalingen (SMT). Deze technologie analyseert eenvoudig gezegd bronteksten en vertalingen, waarna er een overzicht wordt gemaakt van elk woord en de juiste vertaling. Een flinke hoeveelheid kansberekeningen en hogere wiskunde produceert vervolgens een letterlijke vertaling van de brontekst.

Statistische machinevertalingen leveren niet alleen hilarische resultaten op, maar leiden vaak ook tot fouten als een vertaling weer wordt terugvertaald. Vertaal bijvoorbeeld het Engelse ‘translation matters’ (‘vertalen is belangrijk’) naar het Japans (‘hon’yaku jikõ’) en weer terug, en de vertaalmachine komt met een heel ander resultaat: ‘the problem of translation’ (‘het probleem van vertalingen’).

Door de opkomst van nieuwe technologieën lijken de dagen van de statistische machinevertalingen echter geteld. Vorig jaar introduceerde Google een nieuwe versie van de vertaaldienst, gebaseerd op ‘machine learning’. Daarbij wordt er gebruikgemaakt van zogenaamde neurale netwerken, die eigenlijk het menselijke brein nabootsen en continu nieuwe dingen leren. In tegenstelling tot statistische machinevertalingen hoeft er niet meer eens in de zo veel tijd een nieuwe database met vertalingen te worden geüpload, maar kunnen resultaten bijna meteen worden verbeterd.

jonge concurrent

Toch moet de vertaalkwaliteit van de nieuwe versie van Google Translate het afleggen tegen een nog piepjonge concurrent. Het vorig jaar gelanceerde DeepL (deepl.com), een vertaalmachine van Duitse bodem, produceert in veel gevallen beduidend betere resultaten, daarbij geholpen door zijn eigen kunstmatige intelligentie.

Toch laten ook de resultaten van DeepL zien dat machinevertalingen voor bepaalde talen een stap te ver zijn. Sommige talencombinaties zijn nu eenmaal gemakkelijker in ingewikkelde berekeningen te vangen dan andere. Bovendien zijn er niet altijd voldoende gegevens beschikbaar om een vertaalmachine voldoende te kunnen trainen.

Door de opkomst van neurale netwerken kunnen vertaalmachines betere output leveren met minder input. De kwaliteit van die output wordt gemeten met de BLUE-score, die automatisch vertaalde teksten vergelijkt met die van een menselijke vertaler.

Het idee achter BLUE is heel eenvoudig: hoe dichter een automatische vertaling bij een professionele menselijke vertaling komt, hoe beter die is. Daarom streven de bedrijven achter vertaaldiensten naar een zo hoog mogelijke BLUE-score. Toch is de BLUE-score niet het einde van alle tegenspraak. Een hoge BLUE-score voor de ene talencombinatie zegt immers niets over de kwaliteit van een andere talencombinatie. Bovendien is taal geen exacte wetenschap: er zijn meestal veel goede manieren om dezelfde tekst te vertalen, waardoor zelfs een perfecte vertaling een minder goede BLUE-score kan hebben.

correcties

Desondanks lijken neurale netwerken de toekomst van vertaaldiensten te gaan uitmaken. Niet alleen worden de vertalingen steeds beter, dankzij neurale netwerken kunnen vertaalmachines ook snel leren.

Het Amerikaanse bedrijf Lilt introduceerde vorig jaar als eerste ‘adaptieve machinevertalingen’, een technologie die leert van correcties in machinevertalingen en deze direct toepast in volgende vertalingen. Bijkomend voordeel is dat het vertaalprogramma voortdurend meer over taal en over de stijl van de gebruiker leert, zodat vertalingen ook steeds menselijker worden.

Terug naar Google, Amazon en Apple: waarom stonden deze bedrijven in de rij om een conferentie over machinevertalingen te sponsoren? Dat heeft niet in de laatste plaats te maken met het enorme potentieel van de markt voor machinevertalingen. De wereldwijde vertaalmarkt zal in 2021 naar verwachting bijna 47,5 miljard dollar waard zijn. De bedrijven achter de vertaalmachines willen daar graag een graantje van meepikken.

kennis is macht

Bovendien kunnen bedrijven zoals Facebook hun gebruikers vasthouden door berichten automatisch in hun moedertaal te vertalen. Met de kennis van vertalingen kunnen ze ook nog eens besparen op de kosten die ze nu moeten maken om hun platforms te vertalen – iets wat jaarlijks snel miljoenen euro’s kost. En uiteindelijk geldt ook hier: kennis is macht. Wie de beste vertaaldienst biedt, trekt gebruikers en verzamelt kennis en kunde die kunnen worden omgezet in klinkende munt. Maar de snelle opkomst van DeepL laat zien dat de volgende klap weleens uit onverwachte hoek zou kunnen komen.

persoonsgegevens

Veel consumenten en zakelijke gebruikers vertalen hun teksten via Google Translate en concurrerende vertaalmachines. Tijdens een conferentie in Warschau gaf een Duitse hoogleraar op het gebied van vertaalwetenschappen ruiterlijk toe zijn correspondentie niet meer naar een professionele vertaler te sturen, maar die door Google Translate te halen.

Toch kleven er nadelen aan het gebruik aan de vertaalmachines. Gebruikers van Google Translate geven Google een ‘wereldwijde licentie om dergelijke inhoud te gebruiken, te hosten, op te slaan, te reproduceren, (…) en te distribueren’.

Wie Google Translate gebruikt om gevoelige (persoons)gegevens te vertalen, maakt dus inbreuk op de nieuwe Algemene verordening gegevensbescherming (AVG) en riskeert dat de persoonsgegevens op straat belanden of in verkeerde handen vallen. <

Mail de redactie
Mail de redactie
Heeft u een tip over dit onderwerp, ziet u een spelfout of feitelijke onjuistheid? We stellen het zeer op prijs als u ons daarover een bericht stuurt.
Boxie24 haalt de spullen via ‘pick-ups’ op en brengt ze ook weer terug wanneer dat gewenst is. De klant kan thuisblijven.

Kleine huizen zijn gat in de markt voor een bedrijf dat 24 uur per dag spullen ophaalt en opslaat

Als het huis gaat knellen, bieden opslagbedrijven uitkomst. Boxie24 bouwde in korte tijd een opslagimperium op. Het heeft wereldwijd inmiddels 74 vestigingen. ‘Veel huizen zijn te klein voor een racefiets en droogtrommel.’

Het schip waarmee Wim de Vries richting Engeland gaat.

In de haven van Harwich is het zichtbaar wennen aan de grenscontroles. De truckers wachten geduldig

Ruim vier jaar na de Brexit heeft het Verenigd Koninkrijk afgelopen week de langverwachte grenscontroles op goederen weer ingevoerd. Dat raakt truckers die Nederlandse planten vervoeren.

Rits de Boer, inspecteur-generaal van de Arbeidsinspectie: ‘Bij arbeidsmigratie zijn er allerlei kosten die niet worden ingeprijsd.’

Hoofd Arbeidsinspectie: 'Meer arbeidsmigranten kunnen we niet aan'

Rits de Boer ziet in de praktijk welke invloed de grote groep arbeidsmigranten heeft op de leefomgeving en de migranten zelf. Hij is stellig: ‘Nog meer arbeidsmigratie leidt tot nog meer miserabele woon- en werkomstandigheden.’

Dankzij een lening kan de keten de komende jaren haar plannen bekostigen en hoeft Blokker niet te worden verkocht.

Geldverstrekker sluit deal met Blokker, verkoop van de baan

Blokker heeft een akkoord bereikt over een belangrijke herfinanciering, waardoor de toekomst van de winkelketen is veiliggesteld. Dankzij de lening kan de keten de komende jaren haar plannen bekostigen en hoeft Blokker niet te worden verkocht.

Dankzij een lening kan de keten de komende jaren haar plannen bekostigen en hoeft Blokker niet te worden verkocht.

Gordon Brothers, redder van worstelende keten Blokker, heeft een 'geweldige track record'

Een Amerikaanse investeringsmaatschappij die in het verleden onder meer het Britse modeconcern Laura Ashley redde, schiet nu Blokker te hulp. Met een lening van Gordon Brothers is een verkoop van de Nederlandse winkelketen voorlopig afgewend.

Kees en Dries Vahl.

Dankzij aardwarmte zijn de komkommers van de gebroeders Vahl extra groen

De komkommers en paprika’s van Tuinderij gebroeders Vahl worden verwarmd met ‘gratis’ energie uit een diepe aardlaag. Heel rendabel is dat nog niet, maar het tij lijkt nu te keren.