Tehisaruga kõrvaklapid lasevad kuulda vaid üht inimest rahvahulgas, vaadates teda korra (1)

tehnika.postimees.ee

27. mai 2024, 18:44

Pildil on kõrvaklappide süsteemi prototüüp: binauraalsed mikrofonid, mis on kinnitatud tavaliste mürasummutavate kõrvaklappide külge ja kuulavad, mis suunast hääl tuleb. Foto: KIYOMI TAGUCHI / Washingtoni ülikool

Washingtoni ülikooli meeskond on välja töötanud tehisintellekti lahenduse, mis laseb kasutajal kanda kõrvaklappe ja vaadata soovitud kõnelejat kolm kuni viis sekundit, et seejärel kuulda reaalajas vaid selle kõneleja häält isegi siis, kui kuulaja liigub mürarikastes kohtades ega vaata enam kõneleja poole.

Mürasummutavad kõrvaklapid on saanud väga heaks nii-öelda puhta lehe loomisel. Kuid teatud helide lubamine keskkonnast läbi samal ajal teisi kustutades on jäänud teadlastele endiselt väljakutseks. Näiteks Apple AirPods Pro uusim versioon kohandab automaatselt helitasemeid kasutajate jaoks, tajudes, kui nad vestlevad, kuid kasutajal endal on vähe kontrolli selle üle, keda kuulata või millal see juhtub.

Washingtoni ülikooli meeskond on välja töötanud sellise tehisintellekti süsteemi, mis laseb kasutajal kanda kõrvaklappe ja vaadata rääkijat kolm kuni viis sekundit selleks, et teda «registreerida». Süsteem, mida nimetatakse TSH-ks (Target Speech Hearing), summutab seejärel kõik teised helid ja esitab vaid registreeritud kõneleja häält.

Meeskond esitles oma tulemusi 14. mail Honolulus ACM CHI konverentsil. Tarkvarakood on saadaval ka kõigile teistele edasiarendamiseks ja leitav Githubist. Süsteem pole kommertskasutuseks.

«Me kipume mõtlema tehisintellektist kui veebipõhisest vestlusrobotist, mis vastab küsimustele,» ütles vanemautor Shyam Gollakota, UW Paul G. Allen’i arvutiteaduse ja insenerikooli (School of Computer Science & Engineering) professor, «kuid selles projektis arendame me tehisintellekti, et muuta kõigi kõrvaklappe kandvate inimeste kuulmismeelt vastavalt nende eelistustele. Meie seadmetega saab nüüd kuulata üht kõnelejat selgelt, isegi kui mürarikkas keskkonnas paljud teised inimesed samal ajal räägivad.»

Süsteemi kasutamiseks suunab tavaliste mikrofonidega varustatud kõrvaklappe kandev inimene pea rääkija poole ja vajutab nuppu. Selle kõneleja hääle helilained peaksid jõudma peakomplekti mõlemal küljel asuvate mikrofonideni samaaegselt, lubatud on 16-kraadine veamäär (ehk kui klappide kandja ei vaata väga täpselt inimese poole).

Kõrvaklapid saadavad signaali sisseehitatud arvutisse, kus meeskonna masinõppe tarkvara õpib soovitud kõneleja häälmustreid. Süsteem haakub kõneleja häälega ja jätkab selle esitust kuulajale, isegi kui paar liigub ringi. Lahenduse võime registreeritud häälele keskenduda paraneb, kui kõneleja jätkab rääkimist, andes süsteemile rohkem treeningandmeid.

Meeskond testis oma süsteemi 21 katsealuse peal, kes hindasid registreeritud kõneleja hääle selgust keskmiselt peaaegu kaks korda kõrgemaks kui filtreerimata heli.

See töö tugineb meeskonna varasemal «semantilise kuulmise» uuringul, mis võimaldas kasutajatel valida konkreetseid helisid - näiteks linnulaulu või hääli -, mida nad soovisid kuulda, ja tühistas teised helid keskkonnas.

Praegu suudab TSH registreerida korraga ainult ühe kõneleja ning võib kõneleja registreerida ainult siis, kui samast suunast ei tule teisi tugevaid hääli. Kui kasutaja ei ole helikvaliteediga rahul, saab ta kõneleja uuesti registreerida, et parandada selgust.

Meeskond töötab süsteemi laiendamise kallal, et seda saaks tulevikus kasutada erinevates kõrvaklappides ja kuuldeaparaatides.

Uurimistööd rahastas Moore’i Leiutaja Fondi preemia, Thomas J. Cable’i nimeline professuur ja UW CoMotion Innovation Gap Fund.

Allikad: Washingtoni ülikool, Eurekalert

Tehisaruga kõrvaklapid lasevad kuulda vaid üht inimest rahvahulgas, vaadates teda korra (1)

Märksõnad