Cercetătorii au creat un traducător AI care transformă gândurile în text Noua metodă denumită „subtitrări mentale” generează descrieri a ceea ce vede sau își imaginează o persoană, bazându-se pe activitatea sa cerebrală, și o face cu o precizie impresionantă.
Principala diferență a tehnologiei, descrisă în revista Science Advances, față de metodele similare, constă în faptul că ea descifrează imagini înainte ca creierul să exprime gândurile în cuvinte. Această dezvoltare ar putea ajuta, de exemplu, persoanele cu tulburări de vorbire cauzate de accident vascular cerebral să comunice mai eficient.
Conform neurobiologului computațional Alex Huth de la Universitatea California, Berkeley, modelul poate prezice ceea ce urmărește o persoană „cu detalii complexe”. „Este o sarcină dificilă. Este uimitor că se pot obține atât de multe detalii”, a spus el.
Scanarea și predicția
Cercetătorii pot prezice cu destulă precizie de peste zece ani ce vede sau aude o persoană analizând activitatea sa cerebrală. Totuși, descifrarea conținutului complex, precum videourile scurte sau formele abstracte, a fost mult mai dificilă.
Încercările anterioare permiteau identificarea doar a cuvintelor cheie care descriau ceea ce vedea persoana, fără a surprinde contextul complet, care ar include tema videoului și acțiunile sale, explică neurobiologul computațional Tomoyasu Horikawa de la laboratoarele NTT Communication Science, Kanagawa, Japonia. Alte metode foloseau modele AI care construiau singure structura propozițiilor, ceea ce îngreuna verificarea dacă descrierea reflecta cu adevărat ceea ce era reprezentat în creier.
În metoda lui Horikawa, un model lingvistic AI a analizat descrierile textuale a peste 2.000 de videouri, transformând fiecare în o „semnătură semantică” numerică unică. Un alt instrument AI a fost antrenat pe scanările cerebrale ale șase participanți pentru a identifica tiparele de activitate cerebrală corespunzătoare fiecărei semnături atunci când aceștia vizionau videourile.
După antrenament, decodorul putea citi o scanare nouă a creierului unei persoane care privea un video și putea prezice semnătura semantică, iar un alt generator de text AI crea narațiunea corespunzătoare.
De exemplu, un participant urmărea un video scurt în care o persoană sare de pe vârful unei cascade. Folosind activitatea sa cerebrală, modelul AI a ghicit șiruri de cuvinte, de la „curent de primăvară”, la „peste cascada care curge rapid” la a zecea încercare și până la „o persoană sare peste o cascadă adâncă într-un lanț muntos” la a suta iterare.
Cercetătorii au cerut, de asemenea, participanților să-și amintească videourile vizionate. Modelele AI au generat cu succes descrieri ale acestor amintiri, demonstrând că creierul folosește probabil reprezentări similare pentru vizionare și amintire.
Privind spre viitor
Metoda folosește imagistică prin rezonanță magnetică funcțională neinvazivă și ar putea îmbunătăți procesul de traducere a gândurilor în text prin interfețe „creier-computer” implantabile.
„Dacă putem realiza acest lucru cu astfel de sisteme artificiale, poate vom putea ajuta persoanele cu dificultăți de comunicare”, speră Huth, care în 2023 a dezvoltat împreună cu colegii săi un model similar, descifrând limbajul din înregistrări cerebrale neinvazive.
Aceste descoperiri ridică probleme de confidențialitate, deoarece cercetătorii se apropie tot mai mult de dezvăluirea gândurilor intime, emoțiilor și stării de sănătate, care ar putea fi teoretic folosite pentru supraveghere, manipulare sau discriminare, recunoaște Huth. Totuși, nici modelul său, nici cel al lui Horikawa nu trec această limită, deoarece metodele necesită consimțământul participanților și nu pot identifica gânduri personale. „Până acum nimeni nu a demonstrat că acest lucru ar fi posibil”, a asigurat neurobiologul.