În lupta Indiei pentru libertatea inteligenței artificiale

Adithya Kolavi, care a fost martora dezvăluirii publicului modelului de limbaj distructiv al DeepSeek la începutul acestui an, în Bengaluru, India, a simțit un amestec de plăcere și confirmare. Tehnologia chineză rivaliza cu cele mai bune din Occident în ceea ce privește măsurile, dar fusese construită cu mult mai puțini bani într-un timp mult mai scurt.

„M-am gândit: «Așa subminăm cu mai puțin»”, spune Kolavi, președintele în vârstă de 20 de ani al companiei indiene de inteligență artificială CognitiveLab. De ce nu am face-o noi dacă DeepSeek ar putea face asta?

Însă pentru Abhishek Upperwal, președintele Soket AI Labs și designerul unuia dintre primele eforturi ale Indiei de a dezvolta un model de bază, momentul a fost și mai emoționant.

Unitatea lui Upperwal, numită Pragna-1B, se chinuise să se mențină pe linia de plutire cu oferte mici, în timp ce urmărea cum colegii săi din întreaga lume strângeau milioane de dolari. Modelul bilingv avea un număr relativ scăzut de 1,25 miliarde de parametri și avea scopul de a reduce „taxa pe limbă”, costurile suplimentare care vin odată cu faptul că India are un număr mare de limbi de oferit, spre deosebire de SUA sau chiar China. Personalul său îl instruise, dar instrumentele limitate au făcut ca acesta să nu se niveleze. El susține că, prin urmare, proiectul a evoluat de la o strategie la o soluție.

Există o mare probabilitate ca noi să fi fost cei care au construit ceea ce DeepSeek abia a lansat, spune el, dacă am fi fost finanțați acum doi ani.

Bucuria lui Kolavi și disperarea lui Upperwal reflectă gama de sentimente dintre constructorii de inteligență artificială din India. În ciuda reputației sale de centru tehnologic global, China și SUA au ambele avantaje puternice în ceea ce privește dezvoltarea inteligenței artificiale. Acest spațiu s-a deschis în principal pentru că India a investit mult prea puțin în cercetare și dezvoltare, organizații și tehnologie. Predarea modelelor lingvistice este mult mai dificilă decât în alte locuri, deoarece niciun dialect local nu este vorbit de majoritatea oamenilor.

Habitatul software al Indiei a evoluat cu o gândire axată pe servicii pe primul loc și a fost mult timp cunoscut ca back office-ul mondial pentru afacerile cu aplicații. Giganți precum Infosys și TCS și-au construit realizările pe succesOfertă completă de tehnologie, dar introducerea nu a fost nici prioritizată, nici recompensată. În schimb, cheltuielile pentru cercetare și dezvoltare ale Indiei au rămas la 0,65 miliarde de tone cub din PIB în 2024, mult în urma celor 2,68 miliarde de tone cub din China (476,2 miliarde de tone) și 3,5 miliarde de tone cub din SUA (962,3 miliarde de tone). Forța de a construi și comercializa software puternic, de la tehnici la carduri, pur și simplu nu a fost niciodată construită.

În cadrul organizațiilor federale precum DRDO și ISRO (Organizația Indiană de Cercetare Spațială), care sunt mâini izolate ale cercetării de talie mondială, este rar ca descoperirile lor să ajungă în uz uman sau comercial. India nu are puntea necesară pentru a conecta studiile riscante cu procesele industriale, abordarea pe care DARPA o face în SUA. În plus, o mare parte din calificările de top ale Indiei se mută în străinătate, fiind atrase de ecosisteme care pot realiza tehnologii puternice și, în mod crucial, le pot finanța.

Așadar, atunci când modelul de bază open-source DeepSeek-R1 a depășit imediat performanța unora dintre contemporanii săi la nivel global, a atins o sensibilitate. Factorii de decizie politică indieni au trebuit să lupte împotriva decalajului tot mai mare al sistemului de inteligență artificială al țării și a necesității de a-l aborda imediat, ca urmare a acestei lansări de către un startup chinezesc.

India ascultă

Ministerul Electronicii și Tehnologiei Informației (MeitY) a contactat candidați pentru propriile modele de bază ale Indiei în ianuarie 2025, care sunt modele de inteligență artificială de mari dimensiuni care pot fi adaptate pentru o varietate de sarcini. Sectorul său sensibil comun a invitat companiile din sectorul privat de tip „fog” și centre de date să furnizeze capacitate de determinare GPU pentru cercetarea artificială condusă de guvern.

Companii precum Jio, Yotta, E2E Networks, Tata, partenerii AWS și CDAC au răspuns. Prin intermediul acestui acord, MeitY a reușit să achiziționeze aproape 19.000 de GPU-uri la prețuri reduse, care au fost apoi reutilizate din infrastructura privată și alocate exclusiv proiectelor de inteligență artificială de bază. Acest lucru a declanșat un val de idei din partea companiilor care doreau să-și creeze propriile versiuni.

În două săptămâni, avea 67 de idei în proiect. Până la mijlocul lunii martie, această cantitate s-a triplat.

Până la sfârșitul anului 2025, guvernul a anunțat planuri de a construi șase proiecte la scară largă în aprilie, precum și încă 18 programe software de inteligență artificială menite să abordeze probleme precum culturile, educația și schimbările climatice. În special, IA Sarvam atinsă să construiască un model cu 70 de miliarde de parametri optimizat pentru limbile și nevoile indiene.

Pentru o națiune mult timp restricționată de o infrastructură de cercetare limitată, lucrurile s-au mișcat cu o viteză record, marcând o rară convergență de ambiție, talent și voință politică.

„India ar putea realiza un Mangalyaan în domeniul inteligenței artificiale”, a declarat Gautam Shroff de la IIIT-Delhi, menționând misiunea reușită și rentabilă a națiunii pe orbita lui Marte.

Jaspreet Bindra, cofondatoare a AI&, Beyond, o organizație non-profit care își propune să predea alfabetizarea în domeniul inteligenței artificiale, a surprins urgența: „DeepSeek este probabil cel mai bun lucru care s-a întâmplat în India. Ne-a dat un impuls să nu mai vorbim și să începem să facem ceva”.

Problema lingvistică

Una dintre cele mai fundamentale provocări în construirea unor modele fundamentale de inteligență artificială pentru India este diversitatea lingvistică a țării. India prezintă o problemă pe care puțini LLM-i existenți o pot gestiona din cauza celor 22 de limbi oficiale, a sutelor de dialecte și a milioanelor de oameni multilingvi.

În timp ce o cantitate masivă de date web de înaltă calitate este disponibilă în limba engleză, limbile indiene reprezintă împreună mai puțin de 1.% din conținutul online. Studenții LLM care înțeleg modul în care indienii vorbesc sau caută de fapt sunt împiedicați de lipsa datelor digitalizate, etichetate și curățate în limbi precum bhojpuri și kannada.

Tokenizatoarele globale, care împart textul în unități pe care un model le poate procesa, au performanțe slabe și cu multe alfabete indiene, interpretând greșit caracterele sau omițând unele cu totul. În consecință, chiar și atunci când limbile indiene sunt incluse în modelele multilingve, acestea sunt frecvent înțelese greșit și produse incorect.

Și spre deosebire de OpenAI și DeepSeek, care au atins scalabilitatea folosind date structurate în limba engleză, echipele indiene încep adesea cu seturi de date fragmentate și de calitate scăzută, care cuprind zeci de limbi indiene. Acest lucru face ca etapele inițiale ale modelării fundațiilor să fie mult mai complicate.

Cu toate acestea, un grup mic, dar hotărât, de constructori indieni începe să modeleze viitorul inteligenței artificiale al țării.

De exemplu, Sarvam AI a creat OpenHathi-Hi-v0.1, un model open-source pentru limba hindi, care demonstrează modul în care industria indiană de inteligență artificială își dezvoltă capacitatea tot mai mare de a aborda vasta diversitate lingvistică a țării. Modelul, construit pe arhitectura Llama 2 a companiei Meta, a fost antrenat pe baza a 40 de miliarde de token-uri de hindi și conținut aferent în limba indiană, ceea ce îl face unul dintre cele mai mari modele open-source pentru limba hindi disponibile până în prezent.

Modelul multilingv al lui Upperwal, Pragna-1B, oferă încă o dovadă că India are o soluție la propria complexitate lingvistică. Antrenat pe 300 de miliarde de tokenuri pentru doar $ 250.000, acesta a introdus o tehnică numită „tokenizare echilibrată” pentru a aborda o provocare unică în inteligența artificială indiană, permițând unui model de 1,25 miliarde de parametri să se comporte ca unul mult mai mare.

Problema este că limbile indiene combină alfabetele complexe cu gramatica aglutinantă, unde multe unități mai mici de sens sunt legate între ele folosind prefixe și sufixe. Spre deosebire de engleză, care separă cuvintele cu spații și urmează structuri relativ simple, limbile indiene precum hindi, tamilă și kannada adesea nu au limite clare între cuvinte și combină o mulțime de informații în cuvinte individuale. Tokenizatoarele standard au o problemă cu aceste intrări. Acestea ajung să împartă cuvintele indiene în prea multe token-uri, ceea ce suprasolicită datele de intrare și îngreunează înțelegerea eficientă a sensului sau răspunsul precis al modelelor.

Totuși, potrivit lui Upperwal, „un model cu un miliard de parametri era echivalent cu unul cu 7 miliarde, precum Llama 2”, cu noua tehnică. Această performanță a fost deosebit de remarcabilă în hindi și gujarati, unde modelele globale au adesea performanțe sub așteptări din cauza datelor limitate de antrenament multilingve. Aceasta a servit ca o reamintire a faptului că echipele mici pot încă depăși limitele cu ajutorul ingineriei inteligente.

În cele din urmă, Upperwal și-a reutilizat tehnologia de bază pentru a construi API-uri vocale pentru 22 de limbi indiene, o soluție mai imediată, mai potrivită pentru utilizatorii din mediul rural, care sunt adesea excluși din experiențele de inteligență artificială bazate pe limba engleză.

Antrenarea unui model lingvistic este doar primul pas, spune el, dacă drumul către AGI este un proces în o sută de pași.

Startup-urile cu obiective mai îndrăznețe se află la celălalt capăt al spectrului. Krutrim-2, de exemplu, este o Model lingvistic multilingv cu 12 miliarde de parametri optimizat pentru engleză și 22 de limbi indiene.

Krutrim-2 încearcă să rezolve problemele specifice Indiei legate de diversitatea lingvistică, datele de calitate scăzută și constrângerile de cost. Echipa a dezvoltat un tokenizer indice unic, a îmbunătățit mediul de antrenament și a creat imediat modele pentru cazuri de utilizare multimodală și axate pe voce, ceea ce este important într-o națiune în care interfețele text pot fi dificile.

Pariul lui Krutrim este că abordarea sa nu numai că va permite suveranitatea Indiei în domeniul inteligenței artificiale, ci va oferi și un model pentru inteligența artificială care să funcționeze în tot Sudul Global.

India are nevoie, de asemenea, de sprijin instituțional al talentelor, de profunzimea cercetării și de capitalul pe termen lung pentru a produce știință competitivă la nivel internațional, pe lângă finanțare publică și infrastructură de calcul.

În timp ce capitalul de risc încă ezită să parieze pe cercetare, apar noi experimente. Lossfunk, un program de rezidențiat în domeniul inteligenței artificiale în stilul Bell Labs, conceput pentru a atrage cercetători independenți pasionați de știința open source, este acum finanțat personal de Paras Chopra, un antreprenor care a fondat anterior și vândut compania de software ca serviciu Wingify.

„Nu avem modele în industrie sau în mediul academic”, spune Chopra. „Așadar, creăm un spațiu în care cercetătorii de top pot învăța unii de la alții și pot avea un potențial de creștere a capitalului propriu, similar cu cel al startup-urilor”.

Puneți banii pe inteligența artificială suverană.

Cel mai clar indicator al ambițiilor Indiei în materie de inteligență artificială a apărut atunci când guvernul selectat Sarvam AI va dezvolta un model axat pe limbile indiene și fluența vocii.

Ideea este că acest lucru nu numai că ar ajuta companiile indiene să învingă adversarii lumii în domeniul inteligenței artificiale, dar ar aduce beneficii țării în ansamblu. „Dacă devine parte a sistemului India Stack, puteți educa sute de milioane de oameni prin intermediul interfețelor conversaționale”, spune Bindra.

Sarvam a primit acces la 4.096 de GPU-uri Nvidia H100 pentru antrenarea unui model de limbă indiană cu 70 de miliarde de parametri, pe parcursul a șase luni. (Sarvam-1, un model cu două miliarde de parametri, antrenat în 10 limbi indiene, a fost lansat anterior de companie.)

Proiectul lui Sarvam și altele fac parte dintr-o strategie mai amplă numită IndiaAI Mission, o inițiativă națională de 1,25 miliarde de dolari lansată în martie 2024 pentru a dezvolta infrastructura de inteligență artificială de bază a Indiei și pentru a face instrumentele avansate mai accesibile pe scară largă. Misiunea MeitY, condusă de MeitY, se concentrează pe asistarea startup-urilor de inteligență artificială, în special a celor care dezvoltă modele fundamentale în limbile indiene și aplică inteligența artificială în domenii importante precum agricultura, educația și asistența medicală.

În cadrul programului său de calcul, guvernul implementează peste 18.000 de GPU-uri, inclusiv aproape 13.000 de cipuri H100 de ultimă generație, către un grup select de startup-uri indiene, care include în prezent Sarvam, Soket Labs din Upperwal, Gnani AIși Gan AI. ,

Misiunea include, de asemenea, planuri de lansare a unui depozit național de seturi de date multilingve, înființarea de laboratoare de inteligență artificială în orașele mai mici și finanțarea cercetării și dezvoltării în domeniul tehnologiei aprofundate. Obiectivul mai larg este de a dota dezvoltatorii indieni cu infrastructura necesară pentru a construi o inteligență artificială competitivă la nivel global și de a se asigura că rezultatele sunt bazate pe realitățile lingvistice și culturale ale Indiei și ale țărilor din Sudul Global.

Se așteaptă ca impulsul mai amplu al Indiei către tehnologia profundă să genereze investiții în cercetare și dezvoltare de aproximativ 1,4 miliarde TP, 12 miliarde TP în următorii cinci ani, potrivit lui Abhishek Singh, CEO al IndiaAI și director la MeitY.

Aceasta include aproximativ 1,4 miliarde de lire sterline (62 de milioane de lire sterline) prin intermediul Misiunii IndiaAI, aproximativ 1,4 miliarde de lire sterline (32 de milioane de lire sterline) fiind alocați finanțării directe a startup-urilor. Misiunea Națională Cuantică contribuie cu încă 1,4 miliarde de lire sterline (730 de milioane de lire sterline) pentru a sprijini ambițiile Indiei în cercetarea cuantică. Un Fond de Fonduri Deep Tech în valoare de 1,2 miliarde de lire sterline, care vizează stimularea inovației în stadiu incipient în sectorul privat, a fost, de asemenea, anunțat în documentul bugetar național pentru 2025-2026.

Restul, aproape $ 9,9 miliarde, se așteaptă să provină din surse private și internaționale, inclusiv cercetare și dezvoltare corporativă, firme de capital de risc, persoane cu avere netă mare, filantropi și lideri tehnologici globali precum Microsoft.

IndiaAI a primit până acum peste 500 de aplicații de la startup-uri care propun exemple de utilizare în sectoare precum sănătatea, guvernarea și agricultura.

„Am anunțat deja sprijin pentru Sarvam, iar încă 10 până la 12 startup-uri vor fi finanțate exclusiv pentru modele fundamentale”, spune Singh. Accesul la date de instruire, profunzimea talentelor, compatibilitatea cu sectorul și scalabilitatea se numără printre criteriile de selecție.

Deschis sau închis?

Totuși, există unele probleme cu programul IndiaAI. Sarvam este construit ca un model închis, nu open-source, în ciuda rădăcinilor sale în tehnologia publică. Acest lucru a stârnit dezbateri despre echilibrul adecvat dintre binele public și întreprinderea privată.

Potrivit lui Amlan Mohanty, specialist în politici de inteligență artificială, „adevărata suveranitate ar trebui să fie înrădăcinată în deschidere și transparență”. El face referire la DeepSeek-R1, care, în ciuda dimensiunii sale de 236 de miliarde de parametri, a fost pus la dispoziție gratuit pentru uz comercial.

Lansarea sa a permis dezvoltatorilor din întreaga lume să îl perfecționeze pe GPU-uri low-cost, creând variante mai rapide și extinzându-i capacitățile la aplicații în limba engleză.

Hancheng Cao, profesor asistent de sisteme informatice și management operațional la Universitatea Emory, consideră că lansarea unui model open-weight care permite o inferență eficientă poate revoluționa inteligența artificială. „O face utilizabilă de către dezvoltatorii care nu au o infrastructură masivă”.

Cu toate acestea, IndiaAI nu a precizat dacă modelele finanțate public ar trebui să fie open-source.

Potrivit lui Singh, „Nu am vrut să dictăm modele de afaceri”. India a susținut întotdeauna standardele deschise și open source, dar depinde de echipe. Indiferent de cale, scopul este reprezentat de modele indiene puternice.

Există și alte provocări. Sarvam AI a lansat la sfârșitul lunii mai Sarvam M, un LLM multilingv cu 24 de miliarde de parametri, construit pe Mistral Small, un model de succes creat de compania franceză Mistral AI. Cofondatorul Sarvam, Vivek Raghavan, a numit modelul „o piatră de temelie importantă în călătoria noastră de a construi o inteligență artificială suverană pentru India”. Cu toate acestea, numărul de descărcări a fost dezamăgitor, doar 300 în primele două zile. Capitalistul de risc Deedy Das a numit lansarea „jenantă”.

Dincolo de primirea inițială călduroasă, problemele se extind. Mulți dezvoltatori din India încă nu au acces facil la GPU-uri, iar ecosistemul mai larg pentru aplicațiile de inteligență artificială în limba indiană este încă la început.

Întrebarea despre calcul

Cel mai presant blocaj al inteligenței artificiale generative este deficitul de inteligență artificială, nu doar în India, ci în întreaga lume. Pentru țările care încă depind în mare măsură de GPU-urile importate și cărora le lipsește capacitatea de fabricație internă, costul construirii și rulării modelelor mari este adesea prohibitiv.

India încă importă majoritatea cipurilor sale în loc să le producă pe plan intern, iar antrenarea modelelor mari rămâne costisitoare. Din acest motiv, startup-urile și cercetătorii se concentrează pe eficiența la nivel de software, ceea ce implică modele mai mici, inferențe mai bune și reglarea fină a cadrelor de lucru pentru a maximiza performanța pe mai puține GPU-uri.

„Absența infrastructurii nu înseamnă absența inovației”, spune Cao. Sprijinirea științei optimizării este o modalitate înțeleaptă de a opera în limitele impuse.

Totuși, Singh de la IndiaAI susține că situația se schimbă în ceea ce privește provocarea legată de infrastructură datorită noilor programe guvernamentale și parteneriatelor public-private. El susține că, în opinia sa, nu ne vom mai confrunta cu același tip de blocaje în domeniul calculelor ca anul trecut.

India are și un avantaj de cost.

Gupta estimează că construirea unui centru de date hiperscalabil în India ar costa aproximativ 1,4,5 milioane de lire sterline, ceea ce reprezintă aproximativ jumătate din prețul de pe piețe precum SUA, Europa și Singapore. Acest lucru se datorează terenurilor accesibile, costurilor mai mici de construcție și forță de muncă și unui număr mare de ingineri calificați.

Deocamdată, ambițiile Indiei în materie de inteligență artificială par mai puțin a fi legate de depășirea OpenAI sau DeepSeek și mai mult de autodeterminarea strategică. Națiunea pariază că își poate trasa propriul curs, indiferent dacă abordarea sa ia forma unor modele suverane mai mici, a unor ecosisteme deschise sau a unor hibride public-private.

În timp ce unii experți susțin că acțiunea sau reacția guvernului (la DeepSeek) este performativă și în conformitate cu agenda sa naționalistă, mulți fondatori de startup-uri sunt optimiști. Aceștia văd colaborarea tot mai mare dintre stat și sectorul privat ca pe o oportunitate reală de a depăși provocările structurale de lungă durată ale Indiei în domeniul inovației tehnologice.

Nandan Nilekani, președintele Infosys, a îndemnat India să reziste urmăririi unui vis de inteligență artificială similar cu cel al mișcării mele, la un summit Meta care a avut loc anul trecut la Bengaluru.

El a făcut referire la construirea de masterate în drept ca „lăsați-i pe băieții mari din Vale să o facă”. „Vom folosi acest lucru pentru a crea date sintetice, a construi rapid modele lingvistice mici și a le antrena folosind date adecvate”.

Argumentul său conform căruia forța ar trebui să aibă prioritate în fața spectacolului a primit recenzii mixte. Însă acesta reflectă un consens tot mai larg cu privire la faptul dacă India ar trebui să joace un joc cu totul diferit.

Bharath Reddy, cercetător la Institutul Takshashila, o organizație non-profit indiană specializată în politici publice, spune: „Încercarea de a domina fiecare nivel al stivei nu este realistă, nici măcar pentru China”. „Domină un nivel, cum ar fi aplicațiile, serviciile sau talentele, astfel încât să rămâi indispensabil”.

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

ro_RORomanian