OpenAI tutvustas oma esimest «mõtlemisvõimega» tehisaru o1

tehnika.postimees.ee

13. september 2024, 18:00

Uus rohkem inimese moodi mõtlev tehisaru keelemudel teeb vähem vigu, kuid on aeglasem ja maksab rohkem. Foto: OpenAI

OpenAI esitles oma uusimat o1 nimelist tehisaru suurt keelemudelit, mis on nende esimene nn «mõtlemisvõimega» mudelite seerias, mille eesmärk on vastata keerukamatele küsimustele kiiremini ja täpsemini kui inimene. Lisaks toodi turule ka väiksem ja odavam versioon o1-mini.

Suur keelemudel o1 suudab lahendada keerukamaid ülesandeid kui kunagi varem ja oskab analüüsida teaduslikke tekste ning matemaatikaülesandeid, kuid selle eest küsib USA idufirma OpenAI kõrgemat hinda. Tegemist on kauaoodatud ja kuulujuttudega ümbritsetud salapärase «Strawberry» mudeliga, millest varem räägiti, kuid keegi ei teadnud siis veel täpselt, mida see endast kujutab.

Nüüd välja tulnud o1 tähistab OpenAI sõnul olulist sammu inimlaadse tehisintellekti suunas, pakkudes paremaid lahendusi mitmeastmelistele probleemidele ja keerulisema koodi kirjutamisele kui varasemad mudelid.

Samas on see mudel palju kallim ja aeglasem kui senine OpenAI kõige arenenum GPT-4o. Praegu on tegemist esialgse väljalaskega, mida ettevõte nimetab eelvaateks, rõhutades varajast arendusetappi.

ChatGPT Plus-i ja Team-i teenuse kasutajad saavad nüüdsest ligipääsu nii o1 eelvaatele kui ka o1-mini versioonile, samas kui ettevõtte ja haridusasutuste kasutajad peavad veel mõned päevad ootama. OpenAI plaanib tulevikus teha o1-mini kättesaadavaks ka tasuta kasutajatele, kuid täpne kuupäev pole veel selgunud.

Arendajatele on o1 kasutamine API lahenduse kaudu üsna kulukas: o1 eelvaate versioon maksab 15 dollarit miljoni sisend-tokeni eest ja 60 dollarit miljoni väljund-tokeni eest. GPT-4o puhul küsitakse vastavalt 5 ja 15 dollarit.

Uus treeningumetoodika

OpenAI uurimisjuht Jerry Tworek selgitas pressiuudises, et nende uue mudeli o1 treenimisprotsess erineb oluliselt eelkäijatest, mis tagabki selle tehisaru suurema tarkuse ja vähem vigu.

Uus mudel on treenitud täiesti uue optimeerimisalgoritmi ja spetsiaalselt selle jaoks loodud treeningandmestiku abil. Kui eelmised GPT mudelid õppisid andmetest mustreid jäljendama, siis o1 kasutab nn tugevdusõppe (reinforcement learning) tehnikat, mis õpetab süsteemi lahendama probleeme preemiate ja karistuste kaudu ehk nii-öelda «piitsa ja prääniku» meetodil. Mudel kasutab ka «mõtlemisahelat» (chain of thought) sarnaselt inimeste samm-sammulisele probleemide lahendamisele.

Tänu sellele uuele treeningmeetodile peaks mudel olema palju täpsem. Tworek märkis, et o1 kaldub vähem «hallutsineerima» (s.o looma ekslikke väljamõeldud vastuseid), kuid probleemi pole siiski päris lõplikult lahendatud.

Nii lahendas uus mudel vana tuntud «ussimängu» programmeerimise ülesande:

o1 peamine erinevus GPT-4o-st seisneb selle võimes lahendada keerukaid ülesandeid, nagu koodi kirjutamine ja matemaatikaülesannete lahendamine, samuti oskab o1 oma lahenduskäike selgitada. o1 suutis näiteks lahendada 83% rahvusvahelise matemaatikaolümpiaadi ülesannetest, samal ajal kui GPT-4o lahendas neist vaid 13%.

Internetti veel ei lasta

Kuigi o1 on tugev keeruliste probleemide lahendamisel, ei ole see GPT-4o-ga võrdne paljudes muudes valdkondades. Näiteks ei ole see nii täpne faktiteadmiste osas ning puudub ka võimekus sirvida internetti või töödelda etteantud faile ja pilte. Sellest hoolimata usutakse OpenAI-s, et o1 esindab täiesti uut taset tehisintellekti arengus. Mudeli nimi o1 sümboliseerib «loenduri nullimist tagasi 1 peale».

Kui mudelit testiti veebipõhistel programmeerimisvõistlustel Codeforces, edestas see 89% osalejatest. OpenAI väidab, et järgmine selle mudeli uuendus saavutab juba tulemusi, mis on võrreldavad doktorantidega füüsika, keemia ja bioloogia keerukate katseülesannete lahendamisel.

«Mõtlemise» illusioon

Kuigi o1 suudab keerulisi probleeme lahendada, pole see siiski «mõtlemine» nagu inimeste puhul, kirjutab The Verge. Mudeli liides on loodud selleks, et näidata, kuidas see samm-sammult probleemi lahendab, kasutades väljendeid nagu «Ma mõtlen selle läbi» või «Vaatan veel lahenduskäigu üle». Mudeli arendajate sõnul loob see illusiooni inimlikust mõtlemisest, kuigi OpenAI ei võrdle veel seda tehisintellekti inimeste tasemel mõtlemisega.

OpenAI näeb mõtlemisvõimega mudelites siiski olulist sammu inimese tasemel mõtleva tehisintellekti suunas. McGrew sõnul keskendub ettevõte mitmeid kuid just põhjendamisvõime arendamisele, kuna see on võtmetähtsusega keeruliste probleemide lahendamisel. Kuigi praegu on o1 veel aeglane ja kulukas, näevad teadlased selles suurt potentsiaali taolistes valdkondades nagu meditsiin ja inseneriteadus. o1 arendamine on siiski alles algusjärgus.

OpenAI tutvustas oma esimest «mõtlemisvõimega» tehisaru o1

Uus treeningumetoodika

Internetti veel ei lasta

«Mõtlemise» illusioon

Märksõnad