Teadus muudab Google Translate’i 60% täpsemaks

Riin Aljas
, teadustoimetaja
Copy
Juhime tähelepanu, et artikkel on rohkem kui viis aastat vana ning kuulub meie arhiivi. Ajakirjandusväljaanne ei uuenda arhiivide sisu, seega võib olla vajalik tutvuda ka uuemate allikatega.
Google
Google Foto: ROMUALD MEIGNEUX/SIPA/ROMUALD MEIGNEUX/SIPA

Google Translate võtab peagi kasutusele ajuneuroneid imiteeriva algoritmi. 

See on esimene laialt kasutatav tõlkimisega tegelev arvutisüsteem, mis põhineb täielikult tehisintellektil. Võrreldes praegu kasutusel oleva süsteemiga peaks uus algoritm vigade arvu vähendama lausa 60 protsendi võrra, vahendas Google’i teadlaste sõnu teadusajakiri Nature.

Seni on uut süsteemi katsetatud hiina keelest inglise keelde tõlkimisel, ent lähikuudel jõuab see ka teiste keelteni.

Uue algoritmi eduvõti peitub deep learning meetodis (eesti keeles: iseõppivad mitmekihilised neurovõrgud), mis on viimastel aastatel tehisintellekti arengut kõvasti edasi ajanud. Lihtsustatult öeldes kombineeritakse tehislikke neurovõrke – arvutiosakeste kihid, mis imiteerivad seda, mismoodi neuronid ajus omavahel ühenduvad – hiiglaslike andmemahtudega. See tehnoloogia on edu toonud nii piltide ära tundmisel kui ka erinevate arvutimängude mängimisel. Lihtsustatult öeldes arendab see arvuti isemõtlemise oskust.

Nii lõigi Google samataolise süsteemi keele õppimiseks. Seni on Google Translate tehislikke neurovõrke vähe kasutanud. Enamasti analüüsis algoritm teksti sõnade kaupa, õppides erinevate keelte sõnu miljonitest ÜRO ja Euroopa Parlamendi dokumentidest.

Uus süsteem õpib aga ka lauseid esmalt sõnu jupitades. «Mingil põhjusel suudavad need sõnatükid  neurovõrgustikus tähenduse omandada,» ütles Nature’le Google arvutiteadlane Quoc Le. Põhimõte sarnaneb piltide äratundmisele, kus neurovõrgustikud alustavad üksikutest pikslitest jõudes lõpuks keerulisemate aspektideni nagu pildi ääred, geomeetrilised mustrid jne.

Sama neurovõrgustik, mis teksti analüüsis, pakub lõpuks kasutajale ka tõlke.

Loe täpsemalt Nature artiklist SIIT

Kommentaarid
Copy
Tagasi üles