„Este o sclavie digitală”. WIRED: Sunt folosiți minori pentru antrenarea programelor de inteligență artificială

Sistemele de inteligență artificială potenţiale riscuri la adresa societăţii şi omenirii
Sistemele de inteligență artificială potenţiale riscuri la adresa societăţii şi omenirii
7 decembrie 2023, 11:04

Asemeni majorității copiilor de vârsta lui, Hassan, în vârstă de 15 ani, a petrecut mult timp online. Înainte de pandemie, îi plăcea să joace fotbal împreună cu copiii în orașul său natal Burewala din regiunea Punjab a Pakistanului. Dar carantinele aduse de Covid l-au transformat într-un fel de pustnic, dependent de telefonul său mobil.

„Ieșeam din cameră doar când trebuia să mănânc ceva”, spune Hassan, în vârstă acum de 18 ani. El a cerut să fie identificat sub pseudonim, temându-se de acțiuni în justiție.

Spre deosebire de majoritatea adolescenților, el nu făcea scrolling pe TikTok și nu se juca jocuri video. În dormitorul lui din copilărie, liceanul lucra în cadrul lanțului de aprovizionare global al inteligenței artificiale, încărcând și adnotând date în scopul antrenării algoritmilor, pentru unele din cele mai mari companii de IA din lume.

Datele utilizate pentru a antrena algoritmii de învățare automată au fost inițial adnotate de oameni, iar verificarea efectuată de oameni este de asemenea necesară pentru a determina acuratețea lor. Adnotarea datelor variază de la lucruri simple — identificarea imaginilor cu lămpi stradale, de exemplu, sau compararea produselor similare pentru comerțul electronic — și până la unele foarte complexe, precum gestionarea conținutului, care constă în clasificarea conținutului periculos al datelor colectate din toate colțurile internetului. Aceste sarcini sunt adesea externalizate către contractori independenți, prin intermediul platformelor online de crowdsourcing precum Toloka, unde Hassan și-a început cariera.

Un prieten l-a introdus pe site-ul care i-a asigurat un job care poate fi făcut oricând și din orice colț al lumii. Constatase că o oră de muncă îi putea aduce aproximativ 1-2 dolari, mai mult decât salariul minim pe țară, care era de 0.26 de dolari la vremea respectivă. Mama lui este casnică, iar tatăl mecanic. „Poți spune că provin dintr-o familie săracă”, spune el. Când a venit pandemia, el a fost nevoit să lucreze mai mult ca niciodată. Blocat în casă, a cercetat puțin online și a descoperit că Toloka era doar vârful aisbergului.

„IA este ca o cutie magică care poate face orice”, spune Saiph Svage, directorul Laboratorului Civic de IA de la Universitatea Northeastern. „Oameii pur și simplu nu știu că există lucrători umani în culise.”

Unii din acești lucrători umani sunt minori. Platformele cer ca lucrătorii să aibă peste 18 ani, dar Hassan a introdus pur și simplu datele unei rude și a folosit o metodă de plată corespunzătoare pentru a evita verificările – și nu era singurul care procedase așa.

WIRED a vorbit cu alți trei lucrători din Pakistan și Kenya care au recunoscut că s-au alăturat platformelor fiind minori, și chiar a găsit dovezi că această practică este răspândită.

„Când eram la gimnaziu, atât de mulți adolescenți discutau despre joburi online, și cum s-au alăturat folosind actele de identitate ale părinților”, spune un lucrător din Kenya care s-a alăturat platformei Appen la 16 ani și care dorește să rămână anonim. După școală, el și prietenii săi se conectau pentru a completa sarcini de adnotare până noaptea târziu, adesea timp de opt ore sau mai mult.

Appen a refuzat să comenteze.

„Dacă noi suspectăm că un utilizator a încălcat acordul de utilizare, Toloka va efectua o verificare a identității sale și va solicita poza de pe un act de identitate și o poză cu utilizatorul ținându-și îndreptat spre cameră actul de identitate”, spune Geo Dzikaev, șeful operațiunilor Toloka.

Motivată de cursa globală a inteligenței artificale (se preconizează că industria globală de adnotare și colectare a datelor va depăși pragul de 17.1 miliarde de dolari până în 2030, conform Grand View Research, o companie de cercetare și consultanță), platformele de crowdsourcing precum Toloka, Appen, Clickworker, Teemwork.AI și OneForma conectează milioane de contractori individuali remote din emisfera sudică cu companiile tehnologice din Silicon Valley. Platformele postează micro-sarcinile puse de clienții lor, care includ Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing și Adobe. Multe platforme colaborează de asemenea cu platforma Microsoft de gestionare a datelor, Universal Human Relevance System (UHRS).

Acești lucrători sunt stabiliți preponderent în estul Africii, Venezuela, Pakistan, India și Filpine, dar există lucrători chiar și în adăposturile pentru refugiați,  adnotând, evaluând și generând date. Aceștia sunt plătiți per sarcină, remunerarea variind de la un cent la câțiva dolari; sumele mai mari sunt considerate a fi o raritate, potrivit lucrătorilor. „Prin însăși natura sa, acest lucru pare a fi o sclavie digitală, dar este o necesitate pentru a-ți câștiga existența”, spune Hassan, care lucrează în prezent și pentru Clickworker și Appen.

Uneori, acestora li se solicită să descarce conținuturi audio, imagini și clipuri video care să contribuie la seturile de date utilizate pentru antrenarea IA. De obicei, lucrătorii nu știu cu exactitate cum vor fi procesate materialele trimise, care pot fi foarte personale: pe pagina sarcinilor de muncă de pe Clickworker, o sarcină indica: „Arată-ne bebelușul/copilul tău! Ajută-ne să antrenăm IA în baza a cinci poze cu bebelușul/copilul tău”, totul pentru 2 euro. Următoarea era: „Lasă-ți copilul minor (în vârstă de 13-17 ani) să participe într-un proiect interesant cu selfie-uri!”

Unele sarcini presupun gestionarea conținutului: ajutarea IA să diferențieze între conținutul inocent și cel în care figurează violență, discursuri de instigare la ură sau imagini pentru adulți. Hassan a arătat capturi de ecran ale sarcinilor disponibile în ziua când a vorbit cu WIRED. O sarcină de pe UHRS i-a cerut să identifice „la naiba”, „p**dă”, „p*lă” și „c**vă” într-un fragment de text. Pe Toloka i-au fost arătate pagini nenumărate ale unor corpuri semi-goale, inclusiv imagini cu conținut sexual, publicitate la lenjerie intimă și chiar un corp nud dintr-o pictură în stil renascentist. Care a fost sarcina? Diferențierea conținutului pentru adulți de cel inocent, pentru a ajuta alogritmii să deosebească torsurile provocatoare de cele permisibile.

Hassan își amintește că a moderat conținutul de pe UHRS fiind minor, fapt care continuă să-i afecteze sănătatea mintală. El spune că acel conținut era explicit: mărturii ale unor incidente de viol preluate din articole care citează dosare judiciare; discursuri de instigare la ură din postările de pe rețelele sociale; descrieri ale crimelor preluate din articole; imagini sexualizate cu minori; imagini nud cu femei.

Mulți dintre lucrătorii de la distanță din Pakistan sunt minori, spune Hassan. El a efectuat un sondaj cu 96 de respondenți pe un grup de chat de pe Telegram care are aproape 10.000 de lucrători UHRS. Aproximativ o cincime dintre ei au spus că au sub 18 ani.

Clickworker nu a răspuns la solicitările de comentariu. Microsoft a refuzat să comenteze.

Cercetătorii spun că au găsit dovezi că există lucrători minori din toată lumea în industria IA. Julian Posada, profesor asistent de studii americane la Universitatea Yale, care studiază munca umană și producția de date din industria IA, spune că a întâlnit lucrători din Venezuela care s-au alăturat platformelor fiind minori.

Eschivarea de la verificări poate fi relativ simplă. Platformele cele mai permisive, cum ar fi Clickworker și Toloka, pur și simplu le cer lucrătorilor să declare că au peste 18 ani; cele mai sigure platforme, ca Remotasks, utilizează tehnologii de recunoaștere facială pentru ca pozele de pe actele de identitate să fie în concordanță cu aspectul lucrătorilor. Dar chiar și acest filtru poate fi fentat, spune Posada, citând un lucrător care a mărturisit că pur și simplu a ținut telefonul în dreptul feței bunicii sale pentru a trece de verificări.

Partajarea unui singur cont în cadrul unei familii este un alt mod prin care minorii pot accesa lucrul, spune Posada. El a descoperit că în unele domicilii din Venezuela, atunci când părinții gătesc sau se ocupă cu alte îndeletniciri casnice, copiii se conectează pentru a îndeplini sarcinile. De exemplu, o familie de șase persoane pe care a întâlnit-o, având copii cu vârste de până la 13 ani, susținea că împărțeau cu toții un singur cont. Ei gestionau casa ca pe-o fabrică, spune Posada, doi membri ai familiei fiind în fața calculatorului în orice moment al zilei pentru a adnota date. „Părinții aveau dureri de spate pentru că stăteau atât de mult timp așezați. Așa că luau pauze, iar copii îi înlocuiau.”

Hassan a fost acceptat recent într-un program de licență specializat în tehnologia laboratoarelor medicale. Platformele rămân sursa lui principală de venit, lucrând în ture de la 8 dimineața până la 6 seara, și de la 2 noaptea până la 6 dimineața. Cu toate acestea, câștigurile sale au scăzut la doar 100 de dolari pe lună, cererea pentru sarcini depășind oferta după ce mai mulți lucrători s-au alăturat în ultima vreme.

Îl deranjează faptul că sarcinile UHRS sunt remunerate cu doar un cent. „Este o sclavie digitală”, spune Hassan.

Urmărește-ne pe Google News

Ultima Oră

Cele mai citite