Facebook arendab ChatGPT konkurenti, mis on kümme korda kompaktsem ja mahub nutiseadmesse

Facebooki firma Meta keelemudel LLaMA on kõigile vabalt kättesaadav
Kompaktsem lahendus tähendab, et arvutusteks pole enam vaja serverikeskuse võimsust
Paari aasta pärast on tark küsimustele vastav tehisintellekt mahutatud meie nutitelefonidesse

Kui praegu maailmas kuulsust koguv OpenAI keememudel ChatGPT on hiiglaslik ja jookseb paljudes serverites, siis Facebooki firma Meta sarnane tehisintellekt LLaMA-13B on tehnoloogiafirma uute lubaduste järgi ligi kümme korda kompaktsem ja kiirem ning mahub varsti näiteks mõnda nutiseadmesse või arvutisse. See oleks siis nagu oma «tark mees taskus», mis oskab alati nõu anda ja ei pea arvutusteks pöörduma suurte pilveteenuste poole, mis tihti ülekoormuse pärast vastust ei annagi.

Meta loodud LLaMA tehisintellekt on läbimas optimeerimist ja selle parameetrite arv, mille järgi keelemudel töötab ja vastuseid loob, on suurusjärgu võrra kompaktsem, kui OpenAI keelemudel GPT-3, millel tuntud ChatGPT vestlusroboti teenus jookseb. See aga tähendab, et varsti pole enam vaja serverikeskuse võimsust, et küsimustele vastata.

Kõik Meta tehisintellekti mudelid lubatakse anda teadusringkondadele ja kõigile huvilistele vabaks kasutamiseks, kirjutab Meta.

LLaMA (Large Language Model Meta AI) on Facebooki firma Meta loodud suur keelemudel või õigemini mitu keelemudelit, millega tehisintellekt saab anda inimkõnes vastuseid vabas vormis esitatud küsimustele. See kasutab 7-65 miljardit parameetrit, samal ajal kui GPT-3 keerukuseks on 175 miljardit parameetrit.

Nii nagu ChatGPT, on ka LLaMA treenitud suure mahu internetis leiduvate andmete põhjal, kuid kasutatud on vaid avalikult kättesaadavat vabakasutuse litsentsiga sisu: Common Crawl, Wikipedia, C4 Dataset jne. See aga tähendab, et ettevõte võib mudeli koos avatud lähtekoodi ja treeninguandmetega kõigile vabakasutuseks anda. Seni on kõik tehisintellektide võidujooksus osalejad hoidnud oma masina tehnoloogilised detailid ja andmed kiivalt saladuses.

Today we release LLaMA, 4 foundation models ranging from 7B to 65B parameters.
LLaMA-13B outperforms OPT and GPT-3 175B on most benchmarks. LLaMA-65B is competitive with Chinchilla 70B and PaLM 540B.
The weights for all models are open and available at https://t.co/q51f2oPZlE
1/n pic.twitter.com/DPyJFBfWEq
— Guillaume Lample (@GuillaumeLample) February 24, 2023

LLaMA eeliseks on võimalus panna see jooksma ühel graafikakaardil, mis tähendab, et taoline tehisintellekt mahuks ühte masinasse - sülearvutisse või näiteks nutitelefoni, kirjutab Ars Technica. Samas ei tähenda see, et iseõppivad keelemudelid oleksid juba valmis meie igapäevastesse seadmetesse kolima. Selleks võib veel kuluda aasta kuni kaks, arvab vabakutseline arendaja ja arvutiteadlane Simon Willison, kes on Meta avaldatud avatud lähtekoodi uurinud.

Facebook arendab ChatGPT konkurenti, mis on kümme korda kompaktsem ja mahub nutiseadmesse

Märksõnad