Jak se změnily některé strojové překlady za posledních devět let
V roce 2008 jsme otestovali překladač Googlu na několika vzorcích. Třeba na prvním anglickém odstavci o historii České republiky z oficiálního webu www.czech.cz.
Anglický text na stránkách czech.cz:
„The first historically documented Přemyslid was Bořivoj, with whom we are already familiar. He had himself baptized at the Great Moravian court of Prince Svatopluk. He was initially based in the fortified settlement of Levý Hradec, which is where the oldest preserved church in Bohemia is located. He subsequently relocated to Prague. Bořivoj’s wife Ludmila became one of the first Czech saints because she educated her grandson and future patron of Bohemia - Wenceslas - in the Catholic faith. Until his maturity, the position of monarch was filled by his mother, Drahomíra, who resented Ludmila's influence on her son to such an extent that she let her be throttled.“
Překlad z roku 2008:
„Prvním historicky doloženým Přemyslovcem byl Bořivoj, se kterými jsme se již seznámili. On sám měl pokřtít na velkomoravském dvoře knížete Svatopluka. Ten byl původně založen ve hradiště z Levého Hradce, což je oblast, kde nejstarší dochovaný kostel v Čechách nachází. Později přesídlil do Prahy. Bořivoj manželka Ludmila se stala jednou z prvních českých svatých, protože ona jí vnuk vzdělané a budoucí patron Čech - Václava - v katolické víře. Až do své dospělosti, postavení panovníka byla obsazena do své matce, Drahomíra, kteří nenáviděl Ludmila vliv na její syn do té míry, že si ji nechal být Throttled.“
A teď se podívejte, jak si se stejným překladem poradí současná technologie s nasazením strojového učení a neuronových sítí.
Překlad z 20.4. 2017 po nasazení strojového učení:
„Prvním historicky dokumentovaným Přemyslovcem byl Bořivoj, s nímž jsme již obeznámeni. On sám pokřtil u velkomoravského dvora knížete Svatopluka. Původně sídlil v opevněném sídle Levý Hradec, kde se nachází nejstarší zachovaný kostel v Čechách. Následně se přestěhoval do Prahy. Bořivojova manželka Ludmila se stala jedním z prvních českých světců, protože vychovala v katolické víře svého vnuka a budoucího patrona Čech - Václava. Až do své zralosti postavení monarchy zaplnil jeho matka, Drahomíra, která nesnášela Ludmilin vliv na jejího syna do takové míry, že ji nechala být škrtí.“
Jak vidno, překladač učinil za ty roky obrovský skok vpřed a přes drobné chybky si poradí i s podobnými texty, které využívají složitější slovní obraty. Jedinou vážnou chybou je pouze zmínka o křtu Bořivoje na dvoře Svatopluka. Z obou překladů spíše plyne, že Bořivoj přijel na Velkou Moravu a pokřtil Svatopluka.
Zanechme košatých vět o české historii a podívejme se nyní na překlad nepříliš originálního anglického vtipu s využitím přímé řeči a hovorových obratů:
Anglický vtip o ajťácích:
Two IT guys were talking in a bar after work. "Guess what," says the first IT guy, "yesterday, I met this gorgeous blonde in a bar."
"What did you do?" says the other IT guy.
"Well, I invited her over to my place, we had a couple of drinks, we got into the mood and then she suddenly asked me to take all her clothes off."
"You're kidding me!" says the second IT guy.
"So I took her miniskirt off, and then I lifted her up and put her on my desk next to my new laptop."
"Really? You've got a new laptop?"
Překlad z roku 2008:
IT Dva kluci byli mluvili v baru po práci. "Hádej," říká první IT chlap, "včera jsem potkal tento nádherný blondýnka v baru."
"Co jsi to udělal?" praví další IT chlap.
"No, já ji vyzývají, aby moje místo, měli jsme pár nápojů, jsme se dostali do nálady a pak si najednou mě požádal, aby podnikly všechny její šaty."
"Vy jste mě srandu!" říká druhý IT chlap.
"Tak jsem si ji vzal volno minisukně, a pak jsem pomohl jí vstát a dát ji na mém stole vedle mého nového notebooku."
"Opravdu? Máte nový notebook?"
Překlad z 20.4. 2017 po nasazení strojového učení:
Dva IT kluci mluvili po práci po baru. "Hádej, co," říká první IT člověk, "včera jsem potkal tuto nádhernou blondýnu v baru."
"Co jsi udělal?" Říká druhý IT člověk.
"No, pozvala jsem ji na své místo, měli jsme pár nápojů, dostali jsme se do nálady a pak mě najednou požádala, abych si všechny šaty odnesla."
"Děláš si ze mě srandu!" Říká druhý IT člověk.
"Tak jsem si vzala minisuknu, a pak jsem ji zvedl a položil na stůl vedle mého nového notebooku."
"Opravdu? Máte nový notebook?"
I zde je patrný rozdíl. Překlad hovorové angličtiny sice není úplně čistý, ale mnohem srozumitelnější než před lety. Už tedy dávno neplatí, že u delšího textu jsou výstupy ze strojového překladače téměř nepochopitelné. Éra „drahouška zákazníka“ pomalu končí.
A do třetice ještě technický text v angličtině s obraty, které mají více významů
Úvodní odstavec z článku na BetaNews o tom, jak někteří kanadští operátoři chtěli zpoplatnit příchozí SMS/MMS, a zákazníci proto podali hromadnou žalobu:
Unhappy wireless subscribers in Canada have socked Telus and Bell Mobility with class action lawsuits over their intentions to begin charging users for incoming SMS/MMS text messages, a practice already common in the US.
Překlad z roku 2008, jehož sdělení je prakticky nepochopitelné:
Nešťastný bezdrátové odběratelé v Kanadě Telus mít socked a Bell Mobilita s třídou akce soudních nad svými úmysly začít zpoplatnění uživatele na příchozí SMS / MMS zpráv SMS, což je praxe již běžné v USA.
Překlad z 20.4. 2017 po nasazení strojového učení:
Nešťastní předplatitelé bezdrátových sítí v Kanadě ponořili společnosti Telus a Bell Mobility do soudních sporů o svých záměrech začít nabíjet uživatelům příchozí SMS / MMS textové zprávy, což je již v USA běžná praxe.
Překlad je tentokrát srozumitelnější a k dokonalosti mu vlastně chybí jen to, aby podle kontextu lépe pochopil slovíčka socked a charging.