Podobno pierwsze pomysły związane z tłumaczeniem maszynowym (w skrócie MT – od angielskiego określenia Machine Translation)sięgają jeszcze XVII wieku. Oczywiście wtedy, z przyczyn technologicznych, pozostawało to w sferze marzeń. Jednak wraz z rozwojem komputerów, Internetu i sztucznej inteligencji, stało się to możliwe. Dziś systemy tłumaczenia maszynowego to złożone aplikacje, oparte o technologię ML (machine learning), które samodzielnie tłumaczą teksty z języka wyjściowego na docelowy. Wykorzystują do tego celu ogromne bazy danych, zawierające setki milionów słów i zwrotów. Na tej podstawie system podejmuje decyzję, jaki sposób tłumaczenia będzie najwłaściwszy.
Aplikacje MT wykorzystują takie nowoczesne technologie jak deep learning, big data czy cloud computing. W efekcie z roku na rok stają się coraz skuteczniejsze, a praca przez nie wykonywana – coraz dokładniejsza. Jako przykład do dalszych rozważań posłuży nam Microsoft Translator*. Jest to jeden z najbardziej zaawansowanych systemów tłumaczenia maszynowego na świecie. Początkowo opierał się on wyłącznie na statystycznym tłumaczeniu maszynowym (SMT), co oznacza, że dla danego zdania poszukiwane było jego najbardziej prawdopodobne tłumaczenie – statystycznie najczęściej występujące w bazie danych translatora. Co znajduje się w takiej bazie? Najprostszy przykład z brzegu – cała baza wpisów Wikipedii**. Aby pokazać skalę, wystarczy wspomnieć, że sama anglojęzyczna Wikipedia zawiera około 3,5 miliarda słów***.
Obecnie jednak Microsoft koncentruje się na technologii zwanej Neural Machine Translation (NMT). Nie oznacza to, że tłumaczenie statystyczne SMT zostało zarzucone. Nowa technologia ma za zadanie je uzupełniać i przez to znacznie zwiększyć dokładność tłumaczenia. NMT jest rozwijana od 2016 roku. Nadal do działania wymagana jest ogromna baza danych, ale nowy system pozwala tłumaczyć nie tylko na podstawie częstotliwości występowania danego tłumaczenia, ale też kontekstu, w jakim się ono pojawia w tekście. Działa to podobnie jak Kamień z Rosetty. Nie chodzi o (nomen-omen) mechaniczne tłumaczenie słowo-w-słowo, ale o przekład całych fragmentów tekstu (także idiomów) w wielu parach językowych. System Microsoft Translator najpierw „odczytuje” tekst źródłowy, a następnie go dekoduje, aby powstało jak najlepsze tłumaczenie. Nie przekłada słów, tylko całe frazy i zwroty, z uwzględnieniem kontekstu, w którym one występują.
Celem jest, aby tłumaczenie wyglądało na wykonane przez człowieka. Dlatego podczas prac nad tym systemem, programiści „uczą” translatora, aby rozpoznawał i brał pod uwagę takie kwestie jak: rodzaj rzeczowników, poziom formalności wypowiedzi (od slangu po styl formalny), czy rodzaj słowa (rzeczownik, czasownik itp.).
Zalety tłumaczeń maszynowych
Główną zaletą oferowaną przez tłumaczenie maszynowe jest odciążenie tłumacza ze żmudnej pracy polegającej na tłumaczeniu setek, albo tysięcy podobnych do siebie treści. Najlepszy przykład to różnego rodzaju bazy danych. Często zawierają one tysiące zbliżonych do siebie wpisów. Obecnie już nie ma potrzeby, żeby człowiek przepisywał je ręcznie, rekord po rekordzie. Znacznie szybciej, i wielu wypadkach równie dobrze, wykona to system tłumaczenia maszynowego.
Inny przykład, gdzie systemy MT doskonale spełnią swoją rolę, to teksty typowo techniczne lub prawnicze. Słowa pojawiające się w takich materiałach mają bardzo jednoznaczny sposób przełożenia na język docelowy,
a pole do „inwencji twórczej” ze strony tłumacza jest niewielkie.
Druga zaleta to przyspieszenie prac translatorskich. Są fragmenty i teksty, które nie wymagają doświadczonego oka tłumacza, aby zostały prawidłowo przetłumaczone. Szczególnie gdy pracujemy na językach popularnych i przez to posiadających duże bazy danych (np. para językowa polski-angielski). W takim wypadku rola biura tłumaczeń obejmuje weryfikację pracy wykonanej przez maszynę, poprawienie ewentualnych błędów i opracowanie całości w sposób uzgodniony z klientem.
Wady tłumaczeń maszynowych
W tym miejscu jednak nie można zapomnieć o wadach. Zagadnienie to wyjaśnia Agata Nowak z biura tłumaczeń Skrivanek: „są teksty, z którymi systemy tłumaczenia maszynowego prawdopodobnie nigdy sobie nie poradzą, a na pewno nie stanie się to w bliskiej przyszłości. Są to wszelkiego rodzaju treści, które niosą ze sobą przekaz emocjonalny. Nieprędko maszyna będzie potrafiła prawidłowo oddać uczucia i emocje człowieka. A zatem póki co systemy MT nie radzą sobie na przykład z tłumaczeniem tekstów literackich: wierszy, bajek czy pieśni. Nadal potrzebny jest tu doświadczony umysł żywego tłumacza”.
Druga sprawa to fakt, że tłumaczenie maszynowe nadal wymaga sprawdzenia przez człowieka. Nie można po prostu wrzucić tekstu do systemu i oddać klientowi bez weryfikacji, ponieważ to przepis na katastrofę. Dlatego najlepsze rozwiązanie to takie, w którym człowiek współpracuje z maszyną. Rola człowieka w tłumaczeniach maszynowych różni się w zależności od rodzaju dokumentu. Czasem jest to przygotowanie tekstu dla maszyny (np. rozbicie zbyt złożonych zdań na kilka krótszych), a czasem sprawdzenie tłumaczenia po maszynie (tzw. postedycja).. I to jest przepis na dobrze przetłumaczony tekst. Niezależnie od tego, czy mówimy o instrukcji obsługi maszyny drukarskiej, ulotce leku na ból głowy, czy o umowie handlowej.
*- https://www.microsoft.com/en-us/translator/business/machine-translation/