Nalazite se
Članak
Objavljeno: 11.12.2025. 13:14

University of Washington 

AI slušalice: Čujete samo one ljude koje želite

Nove AI slušalice automatski uče s kim razgovarate i omogućuju vam da ih bolje čujete.

AI slušalice: Čujete samo one ljude koje želite

Razgovor u prepunoj prostoriji često dovodi do frustrirajućeg "problema koktel zabave" ili izazova razlikovanja glasova sugovornika od buke. To je mentalno iscrpljujuća situacija koju može pogoršati oštećenje sluha.

Kao rješenje za ovo, istraživači sa Sveučilišta u Washingtonu razvili su pametne slušalice koje proaktivno izoliraju sve sugovornike korisnika u bučnom zvučnom okruženju. Slušalice pokreću AI model koji detektira ritam razgovora i drugi model koji isključuje sve glasove koji ne slijede taj obrazac, zajedno s drugim neželjenim pozadinskim zvukovima. Prototip koristi standardni hardver i može identificirati sugovornike koristeći samo dvije do četiri sekunde zvuka.

Razvojni inženjeri sustava smatraju da bi tehnologija jednog dana mogla pomoći korisnicima slušnih aparata, slušalica i pametnih naočala da filtriraju svoje zvučne pejzaže bez potrebe za ručnim usmjeravanjem "pažnje" umjetne inteligencije.

Prototip sustava, nazvan "proaktivni slušni asistenti", aktivira se kada osoba koja nosi slušalice počne govoriti. Nakon toga, jedan AI model počinje pratiti sudionike razgovora provođenjem analize "tko je kada govorio" i traženjem niskog preklapanja u razgovorima. Sustav zatim prosljeđuje rezultat drugom modelu koji izolira sudionike i reproducira pročišćeni zvuk za korisnika. Sustav je dovoljno brz da izbjegne zbunjujuće kašnjenje zvuka za korisnika i trenutno može žonglirati s jednim do četiri sugovornika u razgovoru uz zvuk korisnika.

Tim je testirao slušalice s 11 sudionika, koji su ocijenili kvalitete poput suzbijanja buke i razumijevanja sa i bez AI filtracije. Sveukupno, grupa je ocijenila filtrirani zvuk više nego dvostruko povoljnije od osnovne vrijednosti.

Preostaje još puno posla kako bi se iskustvo poboljšalo. Što je razgovor dinamičniji, to je vjerojatnije da će se sustav više mučiti jer sudionici međusobno preklapaju ili govore u dužim monolozima. Ulazak i izlazak sudionika iz razgovora predstavlja još jednu prepreku. Autori također napominju da su modeli testirani na engleskom, mandarinskom i japanskom dijalozima te da bi ritmovi drugih jezika mogli zahtijevati daljnje fino podešavanje.

Trenutni prototip koristi komercijalne slušalice, mikrofone i sklopove koji se stavljaju preko uha. Znanstvenici očekuju da će sustav s vremenom biti dovoljno malen da radi na malom čipu unutar slušalice ili slušnog aparata.

Tim je predstavio tehnologiju 7. studenog u Suzhouu u Kini na Konferenciji o empirijskim metodama u obradi prirodnog jezika. Temeljni kod je otvorenog koda i dostupan je za preuzimanje na ovoj poveznici.

Vezani sadržaji
Ključne riječi University of Washington
Komentari

Učitavam komentare ...

Učitavam