Google znovu na tahu

Společnost Google ve středu oznámila aktualizaci Google Translate for Android. Tato zpráva není zdánlivě moc zajímavá, nebýt jednoho detailu. Kromě několika vylepšení totiž tato aplikace od února přinese tzv. „Conversation Mode“ (Režim konverzace), automatického tlumočníka, který má umožnit „plynulou komunikaci s blízkou osobou v jiném jazyce“. Prozatím bude k dispozici jen pro překlad z angličtiny do španělštiny, dá se ale očekávat, že další jazyky budou následovat – podle některých zpráv už pro tuto funkci vznikají audiozáznamy v 15 jazycích.

Google upozorňuje, že půjde o experimentální funkci, a jak taky jinak: neumí si totiž poradit s problémy, s nimiž se tlumočníci potýkají celá staletí – s lokálními přízvuky, dialekty, šumem, hlukem v pozadí ani s rychlou řečí. Přesto je zřejmé, že po pokusu o online strojový překladač (Google Translate) a instantní „videopřeklad“ (Word Lense) přichází další krok směrem k automatizaci lidské komunikace.

Všechny zmíněné aplikace zatím najdou využití hlavně v situacích, kdy profesionální překladatel nebo tlumočník nebude po ruce (na dovolené na Madeiře) nebo by byl drahý (kvalitní překlad blogpostu v dánštině může stát i dva tři obědy), nebo když bude mít uživatel pocit, že automatický překlad prostě pro danou situaci bohatě stačí. Například pro tuto (všimněte si ale, že prezentace není bez chybky): 

Řada odborníků na lokalizaci i překladatelů se však (optimisticky?) domnívá, že snahy o automatizaci překladu povedou k minimálně třem trendům:

  •           poroste poptávka po překladatelských službách obecně. Lidé si časem zvyknou na to, že řada webových stránek, aplikací a produktů bude k dispozici v jejich rodném jazyce a je možné, že právě takovým budou už z pohodlnosti dávat přednost.
  •           zájem o „instantní“ online překlady budou chtít využít firmy, které poskytují překladatelské služby, i ty, které s nimi dosud neměly žádné zkušenosti. Jako alternativa se začnou nabízet online překlady od profesionálních, lidských překladatelů, které samozřejmě nebudou zadarmo (s „online lidskými překlady“ teď například přichází firma ABBYY).
  •           zkušenosti s nedokonalými automatickými překlady přivedou řadu firem i jednotlivců k profesionálním překladatelům a tlumočníkům. Výsledkem můžou být celkově vyšší ceny za kvalitní překlady. Se špatně přeloženými webovými stránkami nic neprodáte a na policii (nebo v soudní síni) vám v cizí zemi smartphone taky sotva pomůže.

Možný je i čtvrtý, pesimistický trend – uživatelé instantních aplikací získají pocit, že cizí jazyky jsou jen takové puzzle, které se jedním kliknutím promění v hotový, relativně jasný obrázek. Jednotlivé dílky sice do sebe často nezapadnou, pár jich někdy chybí a vůbec celý obrázek je jaksi nakřivo, ale levné (případně „free“) aplikaci na kódy nehleďme ;-)

TwitterInstapaperGoogle ReaderEvernoteStumbleUponDiggDeliciousRedditEmailShare
Příspěvek z rubriky * translatio, Czech only a označen , , . Přidat do záložek trvalý odkaz. Trackbacky jsou uzavřeny, ale můžete napsat komentář.

Komentáře (7)

  1. Vloženo 15. 1. 2011 v 18.35 | Trvalý odkaz

    Ano, strojový překlad vyvolává vyšší zájem o kvalitní překlad člověkem – s tím trendem se dá určitě souhlasit.
    Současná (ne)kvalita strojového překladu je ale good enough na to, aby se tyto stroječky daly nasadit tam, kde platí „lepší něco než nic.“ Získané zkušenosti povedou k dalšímu vylepšování technologie, rozdíl v kvalitě se bude zmenšovat.
    Otázka je, jakou dynamiku to dál bude mít.

  2. Vloženo 16. 1. 2011 v 21.01 | Trvalý odkaz

    Rozdíl v kvalitě se bude zmenšovat určitě, sotva ale dosáhne úrovně, v jakou věří (nebo doufají) sci-fisti-)
    Za prvé všechny tři zmíněné aplikace se používají/budou používat v situacích, kdy překladatele nebo tlumočníka stejně dosud málokdo využil (před cestou do zahraničí se většina lidí prostě naučila pár frází nebo si vzala slovník; texty, kterým nerozuměli, prostě nečetli).
    A za druhé si myslím, že zůstane několik oblastí, do kterých strojový překlad nezasáhne, a pokud, neovládne je úplně už proto, že jazyk se vyvíjí a že (tady ale vím, že se neshodneme) jsou určité oblasti, které zautomatizovat nelze: poezii, beletrii, tvorbu titulků, divadelní hry (i proto, že jsou to vlastně oblasti marginální). Ostatně i bývalý programátor href=„http://blogs.oracle.com/translation/2011/01/where_next_for_google_translate_and_what_of_information_quality.html“ rel=„nofollow“>http://blogs.oracle.com/translation/2011/01/where_next_for_google_translate_and_what_of_information_quality.html z Googlu přiznal, že zvýšení objemu dat pro Google Translate o 50 % vedlo jen k 1,5% zlepšení kvality. Takže tak-)

  3. kytkosaurus
    Vloženo 16. 1. 2011 v 22.22 | Trvalý odkaz

    Já tam vidím ještě další problémy. Překládám technické věci (a angličtinu) a v podstatě se dá říct, že mezi anglickými originály, které dostanu na stůl, tvoří skutečné originály, navíc psané rodilým mluvčím, menšinu. Většinou to buď psal někdo, pro koho je angličtina cizí jazyk, nebo to původně bylo napsané v jiném jazyce a ta anglická verze už je překlad. A při takovémto nepřímém překladu se samozřejmě rozdíly v kvalitě minimálně sčítají, spíše bych tipoval, že násobí. Rovněž Google určitě bude mít velké rozdíly v množství podkladů pro různé jazyky (ten pár angličtina-španělština určitě není zvolen náhodou, ale jako pár nejrozšířenějších jazyků, pro které je nejvíc podkladů), takže je dost pravděpodobné, že pro méně obvyklé jazyky, jako je např. čeština, těch podkladů bude řádově méně a bude třeba se spokojit s překladem „přes Aj“ ať už přímo, nebo tím, že v databázi budou převažovat textové páry, získané takto oklikou…

    Další problém je imho v samotném tom hodnocení překladů a srovnávání kvality strojového a „živého“ překladu, protože kdyby kvalita překladu byla opravdu objektivně hodnotitelná, asi by některé agentury už dávno musely fungovat poněkud jinak. Daleko spíše tu bude hrát hlavní roli statistika a prosté porovnávání verzí od různých překladatelů a od různých algoritmů opět strojem. Z principu fungování automatického překladu si např. dovedu představit situaci, kdy se automatizované systémy zlepší natolik, že se jejich překlad bude s překladem živého překladatele statisticky shodovat stejně, jako překlady dvou různých živých překladatelů ale budou u nich stále hrozit „školácké“ chyby, které jsou schopné u technického nebo právního dokumentu znehodnotit celý překlad. A jak tohle hodnotit?

    Na běžnou domluvu, jako příspěvek k obvyklé domluvě rukama-nohama, nebo na překlady věcí, se kterými stejně pracujeme jako s nespolehlivými prameny, které je nutno ověřit, se to určitě bude hodit. Ale na důležité právní nebo odborné věci to opravdu nevidím (a pokud se o takové nasazení někdo bude pokoušet, hrozí průšvih).

    Živý tlumočník má taky výhodu v tom, že může v případě potřeby požádat o vysvětlení (ví, kdy to má udělat, protože jde o nejdůležitější detaily jednání a kdy to nestojí za to, protože jde o něco podružného, kde na detailu tak nezáleží.)

  4. Vloženo 16. 1. 2011 v 23.23 | Trvalý odkaz

    Argument „marginálních oblastí“ vnímám tak, že se při současném stavu poznání prostě nevyplatí investovat třeba do překladu poezie.
    Ostatně i v tom odkazovaném blogpostu se píše: „So to all intents and purposes, the statistical machine translation tools [..] are done.“ a také „So now it is much more important again to add on different approaches and rules-based models.“
    Ani tedy slovo o tom, že statistické postupy jsou konečným řešením a nic dalšího už strojový překlad nabídnout nemůže. Další postup může být ve znamení kombinace statistiky, gramatických modelů, modelů vyšších kontextových úrovní, rozhodně také adaptace (stroj se od člověka bude lépe učit), atd.

    Ohledně argumentu: „Živý tlumočník má taky výhodu v tom, že může v případě potřeby požádat o vysvětlení…“ – je tak složité si představit, že by stroj v případě, že o kvalitě svého výstupu má pochybnost, požádal člověka o zopakování? Beztak interně pracuje ohodnocením (pravděpodobnosti, skore hypotéz,…).

    Mimochodem, v minulém komentáři jsem zapomněl zdůraznit jednu poměrně zásadní věc: V popisované prezentaci „Conversation mode of G. Translate“ nejde jen o strojový překlad text ->překlad → text, ale o úlohu mnohem obtížnější: řeč ->překlad->řeč. Syntéza řeči je jednoduchá, zatímco jak rozpoznávání řeči, tak překlad textu, jsou úlohy samy o sobě obtížné a v lecčems podobné: AI-extremisté dokonce tvrdí, že rozpoznávání ani překlad nebude uspokojivě vyřešen, dokud stroj neporozumí sdělovanému obsahu – a to ve všech jeho významech, je-li jich více.
    Vzhledem k tomu bych tedy „Conversation mode“ považoval za jednoznačný pokrok.

    Tvrzení „jsou určité oblasti, které zautomatizovat nelze“ – si dovolím považovat za příliš silné. O tom jsem ale psal jinde. :-)

  5. Vloženo 18. 1. 2011 v 21.43 | Trvalý odkaz

    Vesměs souhlasím s Jakubem, tedy kytkosaurem. Živý tlumočník totiž ví, že nerozumí, stroj na to bude muset (ještě hodně dlouho) být upozorněn; neví, tedy není-)
    Jako výborný komentář na téma mi pak přijde tento citát (který se ke mně dostal via FB) á la Poeův Havran/Krkavec:
    „Google searches through for matches; when it finds one, it attaches—
    If it doesn’t work, dispatches it as something to ignore
    Matching syllables and timing, more than this, it looks at rhyming,
    Though its crude syntactic priming may yield verses you deplore
    Mind you, many human poets give you verses you deplore,
    Though we warn them “nevermore”“
    (The Digital Cuttlefish)

  6. Vloženo 19. 1. 2011 v 1.46 | Trvalý odkaz

    I wish you could translate my verse, and ask Google to do the same, for comparison.

  7. Vloženo 19. 1. 2011 v 10.34 | Trvalý odkaz

    @Cuttlefish a great idea, I could try that (although translating rhyme is pretty peculiar ;-)

Poslat komentář

Váš e-mail nebude nikdy zveřejněn nebo sdílen. Povinná pole jsou označena *.

*
*

*

Můžete použít tyto HTML tagy a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>