Tänu sellele uuele treeningmeetodile peaks mudel olema palju täpsem. Tworek märkis, et o1 kaldub vähem «hallutsineerima» (s.o looma ekslikke väljamõeldud vastuseid), kuid probleemi pole siiski päris lõplikult lahendatud.
Nii lahendas uus mudel vana tuntud «ussimängu» programmeerimise ülesande:
o1 peamine erinevus GPT-4o-st seisneb selle võimes lahendada keerukaid ülesandeid, nagu koodi kirjutamine ja matemaatikaülesannete lahendamine, samuti oskab o1 oma lahenduskäike selgitada. o1 suutis näiteks lahendada 83% rahvusvahelise matemaatikaolümpiaadi ülesannetest, samal ajal kui GPT-4o lahendas neist vaid 13%.
Internetti veel ei lasta
Kuigi o1 on tugev keeruliste probleemide lahendamisel, ei ole see GPT-4o-ga võrdne paljudes muudes valdkondades. Näiteks ei ole see nii täpne faktiteadmiste osas ning puudub ka võimekus sirvida internetti või töödelda etteantud faile ja pilte. Sellest hoolimata usutakse OpenAI-s, et o1 esindab täiesti uut taset tehisintellekti arengus. Mudeli nimi o1 sümboliseerib «loenduri nullimist tagasi 1 peale».
Kui mudelit testiti veebipõhistel programmeerimisvõistlustel Codeforces, edestas see 89% osalejatest. OpenAI väidab, et järgmine selle mudeli uuendus saavutab juba tulemusi, mis on võrreldavad doktorantidega füüsika, keemia ja bioloogia keerukate katseülesannete lahendamisel.
«Mõtlemise» illusioon
Kuigi o1 suudab keerulisi probleeme lahendada, pole see siiski «mõtlemine» nagu inimeste puhul, kirjutab The Verge. Mudeli liides on loodud selleks, et näidata, kuidas see samm-sammult probleemi lahendab, kasutades väljendeid nagu «Ma mõtlen selle läbi» või «Vaatan veel lahenduskäigu üle». Mudeli arendajate sõnul loob see illusiooni inimlikust mõtlemisest, kuigi OpenAI ei võrdle veel seda tehisintellekti inimeste tasemel mõtlemisega.
OpenAI näeb mõtlemisvõimega mudelites siiski olulist sammu inimese tasemel mõtleva tehisintellekti suunas. McGrew sõnul keskendub ettevõte mitmeid kuid just põhjendamisvõime arendamisele, kuna see on võtmetähtsusega keeruliste probleemide lahendamisel. Kuigi praegu on o1 veel aeglane ja kulukas, näevad teadlased selles suurt potentsiaali taolistes valdkondades nagu meditsiin ja inseneriteadus. o1 arendamine on siiski alles algusjärgus.