[ Zavřít ] 


 

RSS Kanál

 

Google Translate zvládá češtinu zas o něco líp

Neuronové sítě po nějaké době dosáhly dokonce až k češtině a slovenštině. Ty budou nyní poctěny přetlumočením, které je založeno na strojovém učení celých vět - nikoliv pouze za užití frázových slovníků. I když se této pocty zatím dostane jen převodům z/do angličtiny. Ostatní překladové kombinace si ještě chvíli budou muset počkat.

 

Nástroj Překladač Google je přítomen i přímo ve vyhledávání - když ho hledáte:)

Starší frázový model překladu, který de facto vyhledává korespondující slova či slovní spojení mezi dvěma spárovanými slovníky, pomalu nahrazuje nový typ překladu založený na umělé inteligenci, která se pomocí strojového učení učí chápat smysl celých vět. Novinka byla nejprve nasazena u hlavních světových jazyků, nyní obohatí dalších 25 jazyků, mezi nimiž nechybí čeština a slovenština.

„Zjistili jsme, že neuronová technologie zpracovává jazyky lépe, když se jich učí několik najednou. Stejně jako se člověk snadněji naučí novou cizí řeč, pokud už zná příbuzné jazyky,“ popisuje Google způsob, jakým se umělá inteligence učí pracovat s různými jazyky. „Máme například víc dat pro hindštinu než pro maráthštinu a bengálštinu a zjistili jsme, že když se je systém učí všechny současně, zkvalitní se všechny překlady o mnoho víc, než kdyby se je systém učil každý zvlášť.“

Náhled vylepšení překladu z češtiny do angličtiny pomocí neuronového modelu (Zdroj: Google.cz)

I když oba systémy strojového překladu (neuronový a statistický) vycházejí z obrovského množství oficiálních překladů stejných dokumentů do vícero jazyků - a oba určují vztah, mezi překládanými jazyky, je rozdíl v tom, jak každý z těchto systémů tato data využívá. Neuronový překlad se neučí jazyky jako takové, ale sám se učí, jak překládat zadané texty, tak aby co nejvíce odpovídaly textům, které mu poskytli k učení. Zatímco statistický systém porovnává vložená data podle předem zadaných gramatických vzorců.

Jedním ze způsobů, jakým se neuronový model sám učí porozumění jazyku je určování míry podobnosti jednotlivých slov a frází. Díky tomu lépe pracuje s mnohoznačnými i řídce užívanými slovy. Dokáže totiž odhadnout jejich použití podle známých slov stejného druhu. Například u slova tuřín, ač se příliš nevyskytuje, neuronový správně identifikuje významovou blízkost se slovy mrkev či brambora a bude s ním na základě této významové blízkosti pracovat. „K podobným závěrům je schopen dojít i na základě vstupů z různých jazyků, které se učí současně – když budeme mít více ukázkových vět o bramborách v holandštině než v islandštině, odhadne systém na základě znalostí z holandštiny, jak mluvit o bramborách islandsky,“ dodává Google.

Novinka je zatím dostupná jen pro jazykové páry angličtina - čeština a angličtina - slovenština (z relevantních), překlady ostatních cizích jazyků budou následovat. Neuronový model už slouží na většině míst, kde je Překladač Google k dispozici: v aplikacích pro iOS i Android, na adrese translate.google.cz a ve Vyhledávači Google. Brzo bude dostupná i pro automatický překlad celých stran v prohlížeči Google Chrome

Zdroje: Google Blog ČR, tisková zpráva

 

 

 

 

 

Mistral Small 3: malý, ale s velkými možnostmi

Francouzští vývojáři Mistral, známí svou láskou k open-source, přichází s novým AI modelem Mistral Small 3. S 24 miliardami parametrů je sice menší než konkurenční obři, zato však nabízí rychlost, nízké...

DeepSeek R1 a Qwen2.5-Max: přijde osvěžení AI z Číny?

Nové AI modely DeepSeek R1 a Qwen2.5-Max představují dva odlišné přístupy k tréninku a provozním nárokům, které by mohly zásadně ovlivnit budoucí vývoj umělé inteligence. Zatímco DeepSeek R1 se profiluje jako model postavený na...

Grok od xAI: první kroky v podobě samostatné aplikace

Grok, umělý inteligentní asistent od společnosti xAI, udělal další krok na cestě k větší dostupnosti. Coby samostatná aplikace se šíří na další platformy. Co Grok nabídne, kde ho již můžeme vyzkoušet a co teprve přijde? ...

VLC otitulkuje i neotitulkované... samozřejmě s pomocí AI

Nejhorší je, když najdete filmovou perlu, ale nemáte k ní titulky. A když už je najdete, tak nesedí. A i když ve VLC posunete jejich časování vůči časování zvukové stopy, tak se ty stopy neustále rozcházejí - a to dokonce nikoliv symetricky. To pak...


 
© 2005-2025 PS Media s.r.o. - digital world
 

reklama