/nginx/o/2025/04/13/16775519t1ha290.jpg)
«Kaval kui rebane» – nii võiks iseloomustada mitte ainult muinasjututegelast, vaid ka üha nutikamaks muutuvat tehisaru. Kui üks masin püüab teist paljastada, võib mäng kiiresti muutuda luuremänguks, kus reeglid kehtivad ainult seni, kuni neid saab väänata. Aga mida teha, kui seda valvuritki on võimalik petta?
OpenAI teadlased on tuvastanud, et tehisintellekt võib petta ja samal ajal oma kavatsusi ekraanil läbi mõttekäigu põhjendusprotsessi (Chain of Thought ehk CoT) selgelt välja öelda. See avastus toob esile uue probleemidepuntra tehisarude usaldusväärsuse ja turvalisuse tagamisel.