Alătură-te evenimentului în care liderii companiilor au încredere de aproape două decenii. VB Transform reunește oamenii care construiesc o strategie reală de inteligență artificială pentru companii. Află mai multe
Mistral AI, startup-ul francez de inteligență artificială, a anunțat miercuri o extindere amplă în infrastructura de inteligență artificială, care poziționează compania ca răspunsul Europei la giganții americani de cloud computing, dezvăluind în același timp noi modele de raționament care rivalizează cu cele mai avansate sisteme OpenAI.
Compania cu sediul la Paris a dezvăluit Mistral Compute, o platformă cuprinzătoare de infrastructură AI construită în parteneriat cu Nvidia, conceput pentru a oferi întreprinderilor și guvernelor europene o alternativă la dependența de furnizori de cloud din SUA, cum ar fi Servicii web Amazon, Microsoft Azureși Google CloudAceastă mișcare reprezintă o schimbare strategică semnificativă pentru Mistral, de la dezvoltarea exclusivă a modelelor de inteligență artificială la controlul întregului pachet tehnologic.
„Această trecere la infrastructura IA marchează un pas transformator pentru Mistral AI, deoarece ne permite să abordăm o verticală critică a lanțului valoric al IA”, a declarat Arthur Mensch, CEO și cofondator al Mistral AI. „Odată cu această schimbare vine responsabilitatea de a ne asigura că soluțiile noastre nu numai că stimulează inovația și adoptarea IA, ci și susțin autonomia tehnologică a Europei și contribuie la poziția sa de lider în domeniul sustenabilității.”
Cum a construit Mistral modele de raționament care gândesc în orice limbă
Odată cu anunțul privind infrastructura, Mistral a dezvăluit... Magistral o serie de modele de raționament — sisteme de inteligență artificială capabile de gândire logică pas cu pas, similară cu cea a OpenAI modelul o1 și a Chinei DeepSeek R1Însă Guillaume Lample, directorul științific al Mistral, spune că abordarea companiei diferă de cea a concurenților în moduri cruciale.
„Am făcut totul de la zero, practic pentru că am vrut să dobândim expertiza pe care o avem, adică flexibilitatea în ceea ce facem”, mi-a spus Lample într-un interviu exclusiv. „Am reușit de fapt să fim, într-adevăr, foarte eficienți pe pipeline-ul mai puternic de învățare prin consolidare online.”
Spre deosebire de concurenți, care își ascund adesea procesele de raționament, modelele Mistral afișează utilizatorilor întregul lanț de gândire - și, în mod crucial, în limba maternă a utilizatorului, în loc să utilizeze implicit engleza. „Aici avem întregul lanț de gândire care este dat utilizatorului, dar în propria sa limbă, astfel încât acesta să îl poată citi, să vadă dacă are sens”, a explicat Lample.
Compania a lansat două versiuni: Magistral Small, un model open-source cu 24 de miliarde de parametri și Magistral Medium, un sistem proprietar mai puternic, disponibil prin API-ul Mistral.
De ce modelele de inteligență artificială ale lui Mistral au dobândit superputeri neașteptate în timpul antrenamentului
Modelele au demonstrat capacități surprinzătoare apărute în timpul antrenamentului. În special, Magistral Medium și-a păstrat abilitățile de raționament multimodal - capacitatea de a analiza imagini - chiar dacă procesul de antrenament s-a concentrat exclusiv pe probleme matematice și de codare bazate pe text.
„Ceva ce ne-am dat seama, nu chiar din greșeală, dar ceva la care nu ne așteptam absolut deloc, este că, dacă la sfârșitul antrenamentului de învățare prin consolidare, reconectați codificatorul vizual inițial, atunci, dintr-o dată, parcă de nicăieri, vedeți că modelul este capabil să raționeze asupra imaginilor”, a spus Lample.
Modelele au dobândit, de asemenea, abilități sofisticate de apelare a funcțiilor, efectuând automat căutări pe internet în mai mulți pași și executând cod pentru a răspunde la interogări complexe. „Ceea ce veți vedea este un model care face asta, se gândește, apoi își dă seama, bine, aceste informații ar putea fi actualizate. Permiteți-mi să fac ca o căutare web”, a explicat Lample. „Va căuta pe internet, apoi va transmite rezultatele și va afișa rezultatul peste ele și va spune, poate, poate că răspunsul nu se află în aceste rezultate. Permiteți-mi să caut din nou.”
Acest comportament a apărut natural, fără un antrenament specific. „Este ceva ce depinde sau nu de ce să faci în continuare, dar am descoperit că se întâmplă de fapt într-un fel natural. Așa că a fost o surpriză foarte plăcută pentru noi”, a remarcat Lample.
Descoperirea inginerească ce face ca antrenamentul Mistral să fie mai rapid decât cel al concurenților
Echipa tehnică a Mistral a depășit provocări inginerești semnificative pentru a crea ceea ce Lample descrie ca o descoperire inovatoare în infrastructura de instruire. Compania a dezvoltat un sistem de „învățare online prin consolidare” care permite modelelor de inteligență artificială să se îmbunătățească continuu, generând în același timp răspunsuri, în loc să se bazeze pe date de instruire preexistente.
Inovația cheie a implicat sincronizarea actualizărilor modelului pe sute de unități de procesare grafică (GPU) în timp real. „Ceea ce am făcut este să găsim o modalitate de a analiza modelul pur și simplu prin GPU-uri. Adică, de la GPU la GPU”, a explicat Lample. Acest lucru permite sistemului să actualizeze ponderile modelului pe diferite clustere de GPU în câteva secunde, în loc de orele necesare în mod obișnuit.
„Nu există o infrastructură open source similară care să facă acest lucru în mod corespunzător”, a remarcat Lample. „De obicei, există o mulțime de încercări open source similare pentru a face acest lucru, dar este extrem de lent. Aici, ne-am concentrat mult pe eficiență.”
Procesul de instruire s-a dovedit a fi mult mai rapid și mai ieftin decât instruirea prealabilă tradițională. „A fost mult mai ieftin decât instruirea prealabilă obișnuită. Instruirea prealabilă este ceva ce ar dura săptămâni sau luni pe alte GPU-uri. Aici, nu suntem nici pe departe aproape de asta. Depinde de câți oameni am pus pe asta. Dar a fost mai degrabă, a fost cam mai puțin de o săptămână”, a spus Lample.
Nvidia angajează 18.000 de cipuri pentru independența inteligenței artificiale europene
Cel/Cea/Cei/Cele Mistral Compute platforma va rula pe 18.000 dintre cele mai noi procesoare Nvidia Chipsuri Grace Blackwell, găzduit inițial într-un centru de date din Essonne, Franța, cu planuri de extindere în Europa. CEO-ul Nvidia, Jensen Huang, a descris parteneriatul ca fiind crucial pentru independența tehnologică europeană.
„Fiecare țară ar trebui să construiască inteligență artificială pentru propria națiune, în națiunea sa”, a declarat Huang într-un anunț comun la Paris. „Cu Mistral AI, dezvoltăm modele și fabrici de inteligență artificială care servesc drept platforme suverane pentru întreprinderile din Europa, pentru a scala inteligența în diferite industrii.”
Huang a estimat că capacitatea de calcul a inteligenței artificiale a Europei va crește de zece ori în următorii doi ani, fiind planificate peste 20 de „fabrici de inteligență artificială” pe întreg continentul. Mai multe dintre aceste facilități vor avea o capacitate de peste un gigawatt, putând fi clasate printre cele mai mari centre de date din lume.
Parteneriatul se extinde dincolo de infrastructură și include colaborarea Nvidia cu alte companii europene de inteligență artificială și cu Perplexity, compania de căutare, pentru a dezvolta modele de raționament în diverse limbi europene, unde datele de antrenament sunt adesea limitate.
Cum intenționează Mistral să rezolve problemele de mediu și suveranitate ale inteligenței artificiale
Mistral Compute abordează două preocupări majore legate de dezvoltarea inteligenței artificiale: impactul asupra mediului și suveranitatea datelor. Platforma garantează că clienții europeni își pot păstra informațiile în interiorul granițelor UE și sub jurisdicția europeană.
Compania a încheiat un parteneriat cu agenția națională franceză pentru tranziția ecologică și cu Carbone 4, o firmă de consultanță climatică de top, pentru a evalua și minimiza amprenta de carbon a modelelor sale de inteligență artificială pe tot parcursul ciclului lor de viață. Mistral intenționează să-și alimenteze centrele de date cu surse de energie decarbonizate.
„Alegând Europa pentru amplasarea fabricilor noastre, ne oferim posibilitatea de a beneficia de surse de energie în mare parte decarbonizate”, a declarat compania în anunțul său.
Avantajul vitezei oferă modelelor de raționament ale lui Mistral un avantaj practic
Testele inițiale sugerează că modelele de raționament ale lui Mistral oferă performanțe competitive, abordând în același timp o critică comună la adresa sistemelor existente - viteza. Modelele de raționament actuale de la OpenAI și altele pot dura câteva minute pentru a răspunde la interogări complexe, limitându-le utilitatea practică.
„Unul dintre lucrurile care nu le plac oamenilor la acest model de raționament este că, deși este inteligent, uneori durează mult”, a remarcat Lample. „Aici vezi rezultatul în doar câteva secunde, uneori în mai puțin de cinci secunde, alteori chiar mai puțin de atât. Și schimbă experiența.”
Avantajul vitezei s-ar putea dovedi crucial pentru adoptarea tehnologiei în mediul de afaceri, unde așteptarea minutelor pentru răspunsurile inteligenței artificiale creează blocaje în fluxul de lucru.
Ce înseamnă pariul pe infrastructură al lui Mistral pentru competiția globală a inteligenței artificiale
Intrarea Mistral în infrastructură o pune în concurență directă cu giganții tehnologici care au dominat piața cloud computing. Servicii web Amazon, Microsoft Azureși Google Cloud controlează în prezent majoritatea infrastructurii cloud la nivel global, în timp ce jucători mai noi precum CoreWeave au câștigat teren în special în sarcinile de lucru legate de inteligența artificială.
Abordarea companiei se diferențiază de cea a concurenților prin oferirea unei soluții complete, integrate pe verticală — de la infrastructura hardware la modelele de inteligență artificială și serviciile software. Aceasta include Mistral AI Studio pentru dezvoltatori, Chatul pentru productivitatea întreprinderii și Codul Mistral pentru asistență în programare.
Analiștii din industrie consideră strategia lui Mistral ca parte a unei tendințe mai ample de dezvoltare a inteligenței artificiale la nivel regional. „Europa are nevoie urgentă să își extindă infrastructura de inteligență artificială dacă dorește să rămână competitivă la nivel global”, a observat Huang, reiterând preocupările exprimate de factorii de decizie europeni.
Anunțul vine în contextul în care guvernele europene sunt din ce în ce mai îngrijorate de dependența lor de companiile americane de tehnologie pentru infrastructura critică de inteligență artificială. Uniunea Europeană a alocat 20 de miliarde de euro pentru construirea de „gigafabrici” de inteligență artificială pe întreg continentul și Parteneriatul Mistral cu Nvidia ar putea ajuta la accelerarea acestor planuri.
Anunțul dublu al Mistral privind infrastructura și capacitățile de modelare semnalează ambiția companiei de a deveni o platformă cuprinzătoare de inteligență artificială, mai degrabă decât un simplu furnizor de modele. Cu sprijinul Microsoft și al altor investitori, compania a strâns peste 14 miliarde TP1 și continuă să caute finanțare suplimentară pentru a-și susține domeniul de aplicare extins.
Însă Lample vede posibilități și mai mari pentru modelele de raționament. „Cred că atunci când mă uit la progresul intern și cred că pe unele teste de performanță, modelul obținea o precizie de plus 5% în fiecare săptămână timp de, poate, șase săptămâni în total”, a spus el. „Deci, dacă se îmbunătățește foarte rapid, există multe, multe, adică, o mulțime de, știți, idei mici la care vă puteți gândi care vor îmbunătăți performanța.”
Succesul acestei provocări europene la adresa dominației americane în domeniul inteligenței artificiale ar putea depinde, în cele din urmă, de faptul dacă clienții apreciază suficient suveranitatea și sustenabilitatea pentru a renunța la furnizorii consacrați. Cel puțin pentru moment, au de ales.