Maailmas ootamatult üheks tuntuimaks tehisaru teenuseks tõusnud Hiina päritolu DeepSeek on teinud vastuste kvaliteedis tuule alla ka paljudele tuntud USA mudelitele ning lisaks oskab väga hästi vastata eesti keeles. Riigi infosüsteemi ameti (RIA) tehisintellekti ja innovatsiooni talituse juht Markko Liutkevičius selgitab, kui turvaline on selle teenuse kasutamine Eestis.
Eesti ekspert: Hiina tehisaru mudelit DeepSeek tuleks kasutada väga ettevaatlikult (1)
DeepSeek on Hiina idufirma teenus, mis sarnaneb nii välimiselt kui sisult üsna palju USA idufirma OpenAI vestlusrobotiga ChatGPT. Kuid tegemist on Hiina ettevõttega, mis kogub andmeid Hiinas, allub Hiina seadustele ja ei avalda väga palju, mida teenusesse sisestatud andmetega täpsemalt edasi tehakse.
Sellepärast ja eriti just Hiina seadusesätete pärast, mis kohustavad Hiina ettevõtteid ja ka üksikisikuid teatud tingimustel andma teavet riigiasutustele riikliku julgeoleku eesmärkidel, on selle kasutamine seotud riskidega.
«Üheks olulisemaks õigusaktiks on 2017. aastal vastu võetud Hiina riiklik luureseadus (National Intelligence Law), mille kohaselt peavad kõik organisatsioonid ja kodanikud toetama, abistama ja tegema koostööd riigi luuretööga vastavalt seadusele. Siiski ei tähenda see, et kõik ettevõtted peaksid iga päev oma andmeid automaatselt valitsusele edastama, vaid et nad on kohustatud seda tegema, kui riiklikud asutused (nt luure-, julgeoleku- või õiguskaitseorganid) selleks ametliku nõude esitavad,» ütleb Markko Liutkevičius ja soovitab kõigil, kes tahavad äriks tehisintellekti kasutusele võtta, lugeda RIA tellitud analüüsi AI tehnoloogia riskidest ja nende leevendamise võimalustest.
Kui palju DeepSeek saab infot oma kasutajate kohta, millised andmed võivad lekkida Hiina serveritesse?
Lõplik loetelu andmetest, mida DeepSeek kogub, ei ole teada. Eksperdid soovitavad DeepSeeki kasutamisel olla ettevaatlikud, eriti tundlikel võrkudel või isiklike andmete jagamisel.
Soovitatav on vältida platvormi kasutamist täielikult tööalaste või tundlike tegevuste puhul.
Kas on ohutu seda oma veebibrauserist proovida?
Arvestades tänapäevast küberruumi olukorda, AI-mudelite võimalikke haavatavusi ja andmekaitsega seotud ohtusid, on soovitatav DeepSeeki veebibrauserist kasutamisel olla ettevaatlik.
Kasutajad peaksid kaaluma alternatiivseid tehisintellektiplatvorme, mis pööravad rohkem tähelepanu tugevamatele turvameetmetele ja selgematele andmekaitse põhimõtetele.
Milliseid andmeid kohe kindlasti ei maksaks selle keelemudeli lehele sisestada?
DeepSeeki kasutamisel tuleks silmas pidada privaatsuse ja turvalisuse riske ning vältida järgmiste tundlike andmete sisestamist:
- Isikut tuvastav teave: täisnimed, kodused aadressid, telefoninumbrid, e-posti aadressid.
- Finantsandmed: pangakaardi numbrid, pangakonto andmed või muud isikutunnused.
- Ettevõtte tundlik info: ärisaladused, ettevõtte sisemised andmed, kliendiloendid või muu konfidentsiaalne äriteave.
- Terviseteave: meditsiinilised andmed või tervisega seotud info, sealhulgas isiklikud terviseandmed.
- Sisselogimisandmed: kasutajanimed, paroolid ning turvaküsimuste vastused.
- Konfidentsiaalsed suhtlused: ettevõtte sisesed kirjad või sõnumid, samuti kõik tundlikke läbirääkimisi või konfidentsiaalset infot sisaldavad materjalid.
Kas on turvaline jooksutada DeepSeeki mudelit oma serveris? Mida siis peaks tegema, et oma andmeid kaitsta?
Kindlasti ei tohiks DeepSeek mudeli paigaldamisel pimesi seda usaldada.
Oma serveris jooksutamisel nõuab DeepSeeki lokaalne käitamine oskuslikku seadistamist, et andmeid kohalikust seadmest välja ei saadetaks. Oskuslik seadistamine eeldab, et kasutakse turvalist lokaalseadet, tagatakse korralik võrgukaitse (tulemüür, turvapaigad), välditakse tundlike andmete sisestamist ning järgitakse kehtivaid andmekaitse- ja privaatsusnõudeid.
Selliste eelduste täitmise puhul maandatakse andmete privaatsusriske DeepSeeki kasutamisel, aga tuleb kindlasti olla ettevaatlik selle kasutamisel.
Kust on pärit DeepSeeki eesti keele korpus ja eesti keele oskused?
DeepSeek ei paku avalikult kättesaadavat dokumentatsiooni, mis kinnitaks konkreetsete eesti keele korpuste kasutamist.
Lisaks ei avalda DeepSeeki ametlik veebileht ega dokumentatsioon üksikasjalikku teavet andmestike või korpuste kohta, mida nende keelemudelite treenimiseks on kasutatud.