Ett vetenskapligt genombrott i tankeläsning: Uppfinna prylar som alla kan köpa
Ett vetenskapligt genombrott i tankeläsning: Uppfinna prylar som alla kan köpa

Video: Ett vetenskapligt genombrott i tankeläsning: Uppfinna prylar som alla kan köpa

Video: Ett vetenskapligt genombrott i tankeläsning: Uppfinna prylar som alla kan köpa
Video: En enkel övning för bättre självkänsla 2024, Maj
Anonim

Ingenjörer från Institutet för studier av högre nervös aktivitet har kunnat skapa ett system som översätter tankar till begripligt och igenkännbart tal. Genom att kontrollera någons hjärnaktivitet, rekonstruerar teknik tankar till ord.

Detta vetenskapliga genombrott, tillsammans med kraften hos AI och talsyntes, öppnar en ny era i interaktionen mellan datorn och hjärnan. Detta öppnar förstås också nya möjligheter för personer som av en eller annan anledning har tappat talförmågan.

Våra röster hjälper till att hålla kontakten med våra vänner, familj och världen omkring oss, så förlust av röstkraft på grund av skada eller sjukdom är förödande för människor. Men med dagens kunskapsstock har vi ett potentiellt sätt att återställa denna kraft. Vi har visat att med rätt teknik kan människors tankar dechiffreras och förstås av vilken lyssnare som helst”, säger Nima Mesgarani, Ph. D. och en av författarna till en studie utförd vid Mortimer B. Zuckerman Institute of Mental Behavior i Columbia Universitet.

Årtionden av forskning har visat att när människor talar, eller till och med föreställer sig att de uttalar ord, uppstår karaktäristiska aktivitetsmönster i deras hjärnor. Ett tydligt och igenkännbart signalmönster uppstår också när vi lyssnar på någon som pratar, eller inbillar oss att vi lyssnar. Experter har försökt dechiffrera dessa mönster i decennier, men först nu har en framtid öppnat sig för dem, där tankar inte längre kan döljas inuti hjärnan, utan istället kan översättas till talat språk efter behag.

Men att åstadkomma denna bedrift var inte lätt. Tidiga försök att dechiffrera hjärnsignaler från Dr Mesgarani och andra fokuserade på enkla datormodeller som analyserade spektrogram, som är visuella representationer av ljudfrekvenser.

Men på grund av det faktum att detta tillvägagångssätt inte producerade något i närheten av begripligt tal, vände sig Dr Mesgaranis team istället till en vocoder, en datoralgoritm som kan syntetisera tal efter att ha tränats i att spela in människors konversationer.

"Detta är samma teknik som Amazon Echo och Apple Siri använder för att verbalt svara på våra frågor", säger Dr. Mesgarani, som också är docent i elektroteknik vid Fu Foundations Columbia School of Engineering and Applied Science.

För att lära vocodern att tolka hjärnaktivitet, slog Dr Mesgarani ihop med Ashesh Dinesh Mehta, M. D., PhD, neurokirurg vid Northwell Health Physician Partners' Neuroscience Institute och medförfattare till dagens artikel. Dr Mehta behandlar patienter med epilepsi, av vilka några måste genomgå regelbundna operationer.

"Vi arbetade med Dr Mehta och bad epilepsipatienter som redan hade genomgått hjärnoperationer att lyssna på förslag från olika personer medan vi mätte mönster i deras hjärnaktivitet", säger Dr Mesgarani. "Dessa neurala mönster tränade vocodern."

Forskarna bad sedan samma patienter att lyssna på högtalare som uttalar siffrorna 0 till 9 medan de spelade in hjärnsignaler som sedan kunde skickas genom en vokoder. Ljudet som produceras av vocodern som svar på dessa signaler analyserades och förfinades med hjälp av neurala nätverk som artificiell intelligens som efterliknar strukturen hos neuroner i en biologisk hjärna.

Slutresultatet var en robotröst som upprepade en sekvens av nummer. För att verifiera inspelningens riktighet instruerade Dr Mesgarani och hennes team människor att lyssna på inspelningen och rapportera vad de hörde.

"Vi fann att människor kan förstå och upprepa ljud ungefär 75 % av gångerna, vilket är vida överlägset alla tidigare försök", säger Dr Mesgarani. Förbättringen i förståelighet var särskilt tydlig när man jämförde de nya inspelningarna med tidigare försök baserade på spektrogrammet. "En känslig vocoder och kraftfulla neurala nätverk representerade de ljud som patienter ursprungligen hörde med otrolig noggrannhet."

Dr Mesgarani och hennes team planerar nu att testa svårare ord och meningar. De har också för avsikt att utföra samma tester på hjärnsignalerna som avges när en person talar eller föreställer sig tal. I slutändan hoppas de att deras system kan vara en del av ett implantat, liknande de som bärs av vissa epileptiska patienter, som översätter bärarens tankar direkt till ord.

"I det här scenariot, om ägaren av chipet tänker: 'Jag behöver ett glas vatten', kan vårt system ta in hjärnsignalerna som genereras av den tanken och omvandla dem till syntetiserat verbalt tal", säger Dr Mesgarani. "Det är en game changer och för alla som har förlorat förmågan att tala på grund av skada eller sjukdom ger tekniken en ny chans att kommunicera med omvärlden."

Redaktionell kommentar från The Big The One:Eftersom en del av våra medarbetare har ett visst förhållande till neurofysiologi kan vi helt otvetydigt konstatera att att lösa problemet med att läsa tankar och översätta dessa tankar till ord inte är ett problem som någon filosofie doktor kan lösa tillsammans med en intelligent neurokirurg. Detta är en uppgift för forskningsinstitutet som ska lösa det i hundra, tvåhundra eller fler år. Dessutom är det inte alls ett faktum att forskningsinstitutet kommer att lösa detta problem - även om alla NASA-superdatorer förs dit, på vilka en skara ingenjörer kommer att börja simulera neurala nätverk. Men en artikel i en vetenskaplig tidskrift kommer inte att ljuga och faktumet att erkänna tankar är definitivt där. Hur kan då dessa två fakta sammanföras?

Väldigt enkelt. Under de senaste 20-30 åren har ett stort antal helt otroliga och mycket komplexa teknologier som mikroprocessorer och hårddiskar dykt upp i världen. Och varje dag dyker det upp fler och fler nya uppfinningar, som skrivs ner till några "begåvade studenter" som sittandes i garaget har samlat på sig en bit av metallskrot, som forskningsinstituten har kämpat om i 50 år. Och i det här fallet har vi en uppfinning av liknande tillkomst. Det vill säga en utveckling som har gjorts (eller överförts till människor) i många år av någon okänd person, men som skrivits ner till en moster och farbror från Colombia.

I själva verket är det absolut ingen skillnad alls vem Wikipedia kommer att skriva ner som "uppfinnare" av tekniken. Huvudsaken är att tekniken presenterades för världen med hjälp av en vetenskaplig tidskrift. Vidare kommer ett kinesiskt företag att börja producera sådana "prylar" som kommer att vänja folk vid själva tanken att deras huvud nu har blivit helt genomskinligt. Slutligen kommer det tredje steget att vara samma orwellska "1984" när till och med alla människors tankar kan läsas fritt på avstånd. Till exempel genom att placera speciella sensorer i lägenheter eller integrera ett speciellt chip som svarar på hjärnimpulser in i kroppen. Dessutom.

Som regel har varje teknik en omvänd tillämpning. Till exempel, om det finns en teknik för att omvandla nervimpulser till ord, kan du med samma princip förvandla alla ord till någons tankar. I den här situationen har presidenterna i olika länder en storslagen utsikt att få stöd av absolut hela väljarna, eftersom det nu finns en teknisk möjlighet att få varje väljare att ens tänka som han - det räcker med att sätta en korrekt modulerad signal i uttaget.

I allmänhet, vad ska man säga - utsikterna för världen öppnar sig de mest underbara och vi följer utvecklingen av händelser med intresse.

Rekommenderad: