Ascultând „Efectul cocktailului” în creier

Unele persoane se pot concentra pe un singur difuzor, în ciuda unui mediu înconjurător care ascunde vocea unei persoane. Setarea poate fi o sală de clasă, un bar sau un eveniment sportiv - abilitatea nu este unică și a fost descrisă de psihologi drept „efectul cocktail-ului”.

Un nou efort de cercetare condus de un neurochirurg al Universității din California - San Francisco și un coleg postdoctoral s-a concentrat pe descoperirea modului în care funcționează auzul selectiv în creier.

Edward Chang, MD și Nima Mesgarani, Ph.D., au lucrat cu trei pacienți care au fost supuși unei intervenții chirurgicale pe creier pentru epilepsie severă.

O parte a acestei intervenții chirurgicale implică identificarea părților creierului responsabile de dezactivarea convulsiilor. Acest exercițiu implică cartografierea activității creierului pe parcursul unei săptămâni, cu o foaie subțire de până la 256 de electrozi așezați sub craniu pe suprafața exterioară sau cortexul creierului. Electrozii înregistrează activitatea în lobul temporal - acasă la cortexul auditiv.

Chang a spus că abilitatea de a înregistra în condiții de siguranță înregistrări intracraniene a oferit oportunități unice de a avansa cunoștințele fundamentale despre modul în care funcționează creierul.

"Combinația de înregistrări cerebrale de înaltă rezoluție și algoritmi puternici de decodare deschide o fereastră către experiența subiectivă a minții pe care nu am mai văzut-o până acum", a spus Chang.

În cadrul experimentelor, pacienții au ascultat două mostre de vorbire jucate simultan în care fraze diferite au fost rostite de diferiți vorbitori. Au fost rugați să identifice cuvintele pe care le-au auzit rostite de unul dintre cei doi vorbitori.

Autorii au aplicat apoi noi metode de decodare pentru a „reconstrui” ceea ce au auzit subiecții din analiza tiparelor lor de activitate cerebrală.

În mod izbitor, autorii au descoperit că răspunsurile neuronale din cortexul auditiv le reflectă doar pe cele ale vorbitorului vizat. Ei au descoperit că algoritmul lor de decodare ar putea prezice care vorbitor și chiar ce cuvinte specifice asculta subiectul pe baza acelor tipare neuronale. Cu alte cuvinte, ei ar putea spune când atenția ascultătorului s-a îndreptat către un alt vorbitor.

"Algoritmul a funcționat atât de bine încât am putut prezice nu numai răspunsurile corecte, ci și atunci când au acordat atenție cuvântului greșit", a spus Chang.

Noile descoperiri arată că reprezentarea vorbirii în cortex nu reflectă doar întregul mediu acustic extern, ci doar ceea ce vrem sau trebuie să auzim cu adevărat.

Ele reprezintă un progres major în înțelegerea modului în care creierul uman procesează limbajul, cu implicații imediate pentru studiul afectării în timpul îmbătrânirii, tulburării cu deficit de atenție, autismului și tulburărilor de învățare a limbajului.

În plus, Chang spune că s-ar putea ca într-o zi să putem folosi această tehnologie pentru dispozitive neuroprotetice pentru decodificarea intențiilor și gândurilor de la pacienții paralizați care nu pot comunica.

O înțelegere a modului în care creierul nostru este conectat pentru a favoriza unele indicii auditive față de altele poate încuraja noi abordări către automatizarea și îmbunătățirea modului în care interfețele electronice activate prin voce filtrează sunetele pentru a detecta corect comenzile verbale.

Metoda prin care creierul se poate concentra atât de eficient pe o singură voce este un domeniu de interes semnificativ pentru companiile care dezvoltă dispozitive electronice cu interfețe vocale active.

În timp ce tehnologiile de recunoaștere vocală care permit interfețe precum Siri-ul Apple au parcurs un drum lung în ultimii ani, ele nu sunt nici pe departe atât de sofisticate ca sistemul de vorbire uman. De exemplu, o persoană obișnuită poate intra într-o cameră zgomotoasă și poate purta o conversație privată cu relativă ușurință - ca și cum toate celelalte voci din cameră ar fi dezactivate.

Recunoașterea vorbirii, a spus Mesgarani, un inginer cu experiență în cercetarea automată a recunoașterii vorbirii, este „ceva la care oamenii sunt remarcabil de buni, dar se dovedește că emularea automată a acestei capacități umane este extrem de dificilă”.

Articolul de cercetare apare în revistă Natură.

Sursa: Universitatea din California, San Francisco (UCSF)

!-- GDPR -->