Open Minds

La omul prost, nici roboții inteligenți nu trag. Românul care șlefuiește Alexa la Amazon: „Educația e primordială”

Computer Hope Guy
Românii sunt reticenți față de asistenții virtuali vocali precum Alexa/ Sursa Foto: Shutterstock

O avem pe Siri în iPhone și pe Google Assistant pe Android. Unii dintre noi vorbim în casă și cu Alexa de la Amazon. Panorama a stat de vorbă cu Gheorghe Rusu, un matematician român în vârstă de 80 de ani, care a contribuit la dezvoltarea dispozitivului de asistență vocală de la Amazon.

De la spaima și nepriceperea oamenilor, mai ales a celor needucați, de comunicarea cu mașinile și inteligența artificială, până la importanța de a nu fi prost într-o lume în care tehnologia se dezvoltă fulgerător, profesorul Rusu vorbește calm și nuanțat despre neliniștile oamenilor cu privire la aceste dispozitive și despre cum arată viitorul relației om-tehnologie.

Nu ne vom „tâmpi” ca oameni, dar „dacă e prost, omul nu e nici sănătos”, iar educația e „primordială”. Roboții vocali nu ne vor spiona prin case, chiar dacă înregistrează tot ce vorbim cu ei, și nici nu ne vor fura pâinea de la gură, dacă știm să ținem pasul cu tehnologia. Totul e să fim în stare să privim lumea roboților vocali ca pe o imensă oportunitate de dezvoltare, care într-adevăr, uneori poate să dea și rateuri.

La nivel global, în ultimii ani, a crescut cererea pentru asistenții vocali, fie ei integrați în smartphone, fie în alte dispozitive. În 2023 se preconizează că numărul lor va fi egal cu cel al oamenilor: 8 miliarde.  Popularitatea Alexa este și ea în creștere în toată lumea. Amazon a depășit încă din 2019 pragul de 100 de milioane de dispozitive vândute. Rusu spune că aproximativ 15 milioane de echipamente Alexa au fost vândute în Marea Britanie și 75 de milioane în SUA.

Gheorghe Rusu a ajuns colaborator al companiei pe partea de suport, în calitate de mentor, după ce a absolvit un curs postuniversitar la Universitatea Stanford, pe Inteligență Artificială. Amazon și alte firme de tehnologie au venit la el cu oferte de muncă.

Ce face mai exact matematicianul român pentru dezvoltarea Alexa? „Fiecare echipament la locul lui de muncă poate să aibă anumite probleme, nu neapărat tehnice, sunt și de suport, de educare, iar aceste probleme se scriu undeva pentru a fi culese la diferite nivele. La primul nivel se pot rezolva, iar dacă nu se pot rezolva, se trece la al doilea nivel, și dacă nu se pot rezolva se trece la următorul, unde colaborez și eu, un fel de high-level support”, își explică Rusu, pe scurt, rolul, la începutul interviului acordat Panorama, în cadrul rubricii Open Minds.

Totuși, Alexa și în general asistenții virtuali sunt mai puțin prezenți în România. În 2020, în țara noastră, doar 1% dintre români folosiseră un asistent virtual sub forma unui smart speaker sau prin intermediul unei aplicații, conform Eurostat.  Fruntașe la acest capitol erau Marea Britanie, Olanda și Danemarca.

Matematicianul este de părere că nu lipsa disponibilității limbii române în această lume a asistenților vocali ar fi motivul principal, ci lipsa unei educații digitale temeinice și de nevoia unei schimbări de perspectivă. Adică să vedem lucrurile în corelația om-mașină, ceea ce ar duce la o „dezvoltare nemaipomenită pe lumea asta”.

Panorama: Domnule Rusu, în calitatea dumneavoastră de colaborator al Amazon, puteți să-mi dați un exemplu specific de cum ați contribuit la dezvoltarea Alexa?

Gheorghe Rusu: La început, când am venit la Amazon, am observat, de exemplu, că în momentul în care un user îi spunea ceva Alexei, ea de obicei răspundea că nu înțelege și cerea să i se repete întrebarea. O idee pe care am propus-o și a fost adoptată a fost ca Alexa să repete ce a înțeles. A fost adoptată și făcută un skill. Termenul de „skill” e specific pentru Alexa, în general, în programare, se folosește „script”, este vorba de o listă de comenzi.

Caracteristica asta este foarte utilă și pentru cei care nu vorbesc corect engleză sau pentru cei care nu au accentul. De fapt, Alexa îi poate ajuta să-și dezvolte capacitatea de a vorbi engleza sau chiar altă limbă, pentru că e disponibilă în vreo 15 limbi. Din păcate, româna nu am reușit încă să o implementăm pe acest sistem.

Lipsa educației nu face casă bună cu Inteligența Artificială. Când ești analfabet, un stilou e ceva inutil

P: Chiar așa, Alexa nu a prins atât de mult la români și nici alți asistenți vocali, de fapt. De ce? E doar limba un impediment?

G.R: Nu, nu e doar limba. Poate e doar deformare profesională, dar eu susțin că orice societate, orice țară, trebuie să pună baza în educație.

Educația ar trebui să aibă o prioritate absolută, poate chiar și mai mult decât sănătatea. Dacă e prost, omul nu e nici sănătos. Educația e primordială. Eu sunt profesor, am învățat sute de oameni matematică, și pot să spun că la români, de mai mult timp – nu aș face legătură neapărat cu Revoluția, e chiar de dinainte de Revoluție –  eficiența educației a scăzut enorm, din păcate. Să căutăm de ce e complicat de discutat.

Dar revin: în Anglia, din liceu, se învață un limbaj de programare, specific Inteligenței Artificiale, numit Python. E obligatoriu în toate liceele. Pe când în România, ani de zile a fost un limbaj dBase, apoi a venit Pascal, care nu sunt rele, dar nu se compară. Dacă ei fac aici, în liceu, Python, prin intermediul căruia înțeleg foarte bine cum lucrează aceste Inteligențe Artificiale, acestea devin ca o unealtă.

Problema e că în România populația nu simte necesitatea, nefiind educată în sensul ăsta. Și îți mai dau un exemplu: stiloul. Când România avea undeva la 80% analfabeți, sigur că piața de stilouri nu era dezvoltată, un analfabet nu avea nevoie de stilou. Îmi amintesc că prin anii ‘50-‘60, când s-a răspândit cultura – și nu zic că au răspândit-o comuniștii, ci că a fost nevoia generală de cultură în lume, în toată zona europeană cel puțin – asta a dus la apariția obligativității școlii. Lumea era înnebunită să găsească atunci stilouri bune și ieftine. Așa și cu Alexa: de ce și-ar lua-o oamenii când ei știu cel mult să pună niște întrebări? Când Alexa presupune utilizarea în diverse situații variate, căci a trecut de sute de mii de skill-uri. Adică e ca și cum ai da banii pe ceva ce nu prea știi să folosești.

P: Deci, spuneți că în România este vorba despre lipsa unei educații digitale.

G.R.: Corect. Uitați-vă la toată digitalizarea societății. Există o frică și hai să o luăm pe cea primordială, adică pierdutul locului de muncă.

Ăștia care fac hârtii se gândesc: „Mă, dacă nu mai fac hârtii, dosare, eu ce mai fac?”. Ei nu se gândesc că s-ar putea gândi la a face treabă de om, nu de robot.

P: La un moment dat, spuneați că aveți în plan s-o faceți pe Alexa să vorbească și limba română. Ați mai făcut progrese în sensul ăsta?

G.R.: Nu, proiectul e fezabil, dar aș avea nevoie de vreo 10 milioane de dialoguri și ca să le colectez am nevoie de ajutor. Am primit niște sugestii, am vorbit la un radio pentru arhiva de dialoguri la un moment dat, dar au rămas vorbe. Dacă nu intervin instituțiile, e dificil. Polonezii, de exemplu, au pus finanțare de la buget. Ai nevoie de dialoguri pentru că e ca și cum ai învăța un copil să vorbească. În practică, e vorba de training.

Viitorul e al oamenilor care vorbesc cu calculatoarele. Ne vom tâmpi?

P: Spuneați mai înainte de teamă. Apropo de asta, o critică la adresa asistenților vocali este cu privire la sănătate, anume că pe viitor, dacă lăsăm acești asistenți să găsească lucruri pentru noi, să ne livreze informațiile imediat, pe termen lung, ar apărea o deteriorare a memoriei.

G.R.: Aici e o veche discuție. De exemplu, se zice că dacă copilul nu învață tabla înmulțirii, nu-și educă mintea. Se pleacă de la ideea că a învăța tabla înmulțirii înseamnă să îți formezi un soi de agloritmică. Dar omul ca ființă naturală nu se naște scriind. Eu zic că în evoluția computerelor, noi suntem acum la primii pași în trecerea la interfața între om și computere de orice fel de tip vocal. Programatorii lucrau într-un limbaj apropiat de al mașinii, iar apoi, în ’93-’94, a apărut interfața grafică, o binecuvântare folosită peste tot acum. Microsoft a făcut-o industrial.

Deci, acum se lucrează pe tastatură și cu mouse-ul – se numește Graphical User Interface, iar lumea e mulțumită. Eu zic că o să vină era Voice User Interface. Oamenii vor vorbi cu calculatoarele. Sunt aproximativ 2 miliarde de analfabeți în lume, ei nu știu să scrie, nici să folosească tastatura. Pentru ei, posibilitatea de a lucra cu computere înseamnă să mimeze fără să știe butoanele unui telefon mobil și să le învețe cum învățau egiptenii hieroglifele. Acești oameni vor învăța și ei să comande ceva prin voce și cred că ăsta va fi viitorul, prin voce.

Asta înseamnă că oamenii se vor tâmpi? Pentru că nu vor mai ști să scrie de mână? Aici, în Marea Britanie, foarte mulți nu mai scriu de mână, tastează tot timpul.

P: Studiile spun că scrisul de mână angrenează motricitatea și concentrarea, pe litere, pe formă, deci creierul ar fi mai activ.

G.R.: Sigur, acum știi cum e, și despre cafea unii zic că-i bună, alții că nu. Eu nu cred că lumea se va prosti din cauza asta. Cred că dacă se prostesc, o fac din alte motive. Părerea mea e că nu roboții și avansul științific sunt problema, noi ar trebui să ne gândim la dezvoltarea omului în alte direcții. Nu aș merge neapărat pe creativitate – că acum toți pot deveni creativi, dar probabil ar trebui gândite niște activități în sensul ăsta.

P: Activități care să țină mintea activă? Ce înseamnă asta mai specific în viziunea dumneavoastră?

G.R.: Da, activități prin care omul să învețe să lucreze cu o mașină.  În momentul actual, skill-urile pentru Alexa sunt, de exemplu, foarte bune pentru așa ceva. Dar nu i-aș face pe toți programatori. Apropo de asta, Amazon dă bani pentru ca oamenii să vină cu propuneri pentru dezvoltarea ei. De la aceste cerințe și sugestii ale clienților, se pot dezvolta noi funcții pentru echipament și organizare. Adică sugestiile strânse sunt germenii unei noi funcționalități a echipamentului sau a softului cu care e dotat echipamentul.

Până la urmă, văd totul într-o corelație om-mașină, atunci ar fi o dezvoltare nemaipomenită pe lumea asta.

Pentru că nu trebuie să gândim în termeni exagerați. Cine gândește că roboții precum GPT-3 (chatbot recent lansat, capabil de a genera texte la nivelul celor făcute de om – n.r.) sunt ceva nemaipomenit exagerează. Da, acești roboți pot scrie cărți. Dar de unde vine de fapt asta? Inteligența Artificială se bazează pe metode matematice din domeniul științei probabilităților, dar pe partea de statistică. Asta este de fapt: o statistică enormă, pe care o minte umană ar înnebuni s-o analizeze, căci sunt sute de miliarde de date.

Chiar am făcut un proiect aici, într-un orășel din Anglia, să programăm computerul să ne arate unde vor fi incendii în următoarea perioadă. Ei, dar știi de când aveau cei din orășel datele? Din 1927. Aveau toate datele, nu doar despre locațiile în care au fost incendiile, ci și zonele cu instalațiile de apă, toate frumos arhivate. Datele au fost băgate în computer și el nu a făcut altceva decât să facă o probabilitate. Dar nu pentru că era deștept sau Baba Vanga. El doar analiza, e matematică. Nu atinge ce are creierul uman.

Derapajele asistenților vocali vin din elementele imaginilor noastre virtuale

P: Deci putem spune că diversele derapaje ale asistenților vocali vin dintr-o eroare de statistică, nu? Mai demult, de exemplu, Alexa i-a spus unei femei din Marea Britanie să se înjunghie pentru „binele suprem”. Cum ajungem la astfel de replici?

G.R.: Episodul ăsta nu-l cunosc specific.

Ideea e că Alexa e un aparat de o sensibilitate foarte mare, prinde chiar și șoaptele. Există niște turnuri care primesc semnalele astea, se duc în niște servere unde sunt mulți oameni, peste 20.000, care ascultă ce s-a înregistrat și care scot ceea ce nu trebuie, conform unor proceduri bine stabilite.

Problema e, apropo de exemplul pe care-l dai, că baza e un fel de algebră, vorbim de niște matrici uriașe care pot să conducă uneori la niște concluzii precum aceasta, din păcate. Acum, nu știu exact, probabil femeia a avut vreo suferință pe care a verbalizat-o și Alexa o fi înregistrat și s-a produs o eroare.

Pentru că toți avem o imagine virtuală, tu ai o imagine virtuală la Google, eu am o imagine virtuală la ei. Există o domnișoară Dana Mischie la Google și un domn Gheorghe Rusu, imagini pe care ei le încarcă cu tot ce știu despre noi. La fel la Facebook și așa mai departe. Problema e că, la un moment dat, se poate ajunge la concluzii nefericite. Pentru asta lucrăm și noi la Alexa, eu mă ocup să îi instruiesc pe alții în sensul ăsta, pentru că eu doctoratul în asta îl am, în probabilități.

Încă o dată, Inteligența Artificială e numai probabilitate cu statistică. E foarte greu pentru cineva care nu a studiat zona asta să priceapă fundamentele AI. Și astfel, o dată la nu știu câte statistici, apare că cea mai bună soluție să bei un pahar de Pepsi e să ți-l torni în cap.

P: Alexa și Google Assistant ascultă și când nu le vorbești. Cu privire la Alexa, citeam într-un articol o comparație cu un câine: și el aude tot ce spui pe lângă el, dar reacționează doar la anumite cuvinte. Dacă o am în casă pe Alexa și vorbesc în română, în condițiile în care nici nu este una dintre limbile disponibile în sistem, ce se întâmplă cu înregistrările astea?

G.R.: Conversațiile în română se colectează și se vând la cei care cumpără date în română. Există firme care fac comenzi de date audio, ei le cumpără. Dar e foarte scump, să știi.

Datele colectate de asistenții vocali sunt anonimizate

P: Eu, ca utilizator, nu ar trebui să știu acest lucru? Nu ar trebui să-mi dau un fel de acord?

G.R.: Legal, e suficient că sunt anonimizate. Google, Amazon, Apple nu îți vând datele și apoi adaugă: a vorbit Dana Mischie cutare lucru. Sunt anonimizate și se vând vorbe goale. Aș zice că oamenii nu trebuie să aibă nicio teamă în sensul ăsta, sunt protejați de societate. Deci în privința ascultatului, nu au de ce să se teamă, pentru că datele astea nu se dau.

P: Domnule Rusu, în încheiere, aș vrea să vă întreb care ați spune că e un dezavantaj al asistenților vocali?

G.R.: Aici revin la prima parte a discuției. Cred că cel mai mare dezavantaj – și nesesizat – este că de fapt nu se lucrează suficient în a dezvolta inteligența umană, ca să interacționeze cu acești agenți inteligenți. Educația, în special în România, nu merge spre crearea unei societăți care să știe să lucreze cu ei.

Despre Gheorghe Rusu

Este colaborator al Amazon de șase ani și fondatorul RolaxIT, un start-up de tehnologie, axat pe dezvoltarea de chat-boți care pot fi folosiți în economie (de la spitale, până la hoteluri și restaurante), precum și pe servicii de transcriere și traducere automată, promovate prin brandul Scriptoman. Este și unul dintre programatorii primului calculator funcțional românesc, CIFA-3.

A absolvit Facultatea de Matematică a Universității din București, iar ulterior Relații Economice Internaționale, la Academia de Studii Economice din București. În 2016, a absolvit și cursul postuniversitar de machine-learning de la Universitatea Stanford.


Ca să fii mereu la curent cu ce publicăm, urmărește-ne și pe Facebook.


Dana Mischie

Și-a început drumul în presă în facultate, scriind recenzii de filme și cărți pentru un blog cultural. Apoi, la master, s-a angajat la ziarul Adevărul, unde a fost pe rând redactor, reporter și apoi editor. Aici, a realizat interviuri, analize și reportaje despre personalități culturale, fenomene sociale, subiecte medicale și despre digitalizare.