spot_img
15.5 C.
Londra
spot_img
AcasăIAMistral launches new code embedding model that outperforms OpenAI and Cohere in...

Mistral lansează un nou model de încorporare a codului care depășește OpenAI și Cohere în sarcinile de recuperare din lumea reală

Abonează-te la newsletter-ele noastre zilnice și săptămânale pentru cele mai recente actualizări și conținut exclusiv despre tehnologiile inteligentei artificiale de top. Află mai multe


Având în vedere creșterea cererii pentru generarea augmentată de date (RAG) la nivel de întreprindere, furnizorii de modele au ocazia să își ofere perspectiva asupra modelelor de încorporare. 

Companie franceză de inteligență artificială Mistral și-a aruncat pălăria în ring cu Codestral Embed, primul său model de embedding, despre care a spus că depășește modelele de embedding existente pe teste de performanță precum SWE-Bench.

Modelul este specializat în cod și „are performanțe deosebit de bune pentru cazurile de utilizare a regăsirii datelor de cod din lumea reală”. Modelul este disponibil dezvoltatorilor pentru $0.15 per milion de token-uri. 

Compania a declarat că Codestral Embed „depășește semnificativ performanțele principalilor integratori de cod”, precum Cod de călătorie 3, Coerență Încorporare v4.0 şi OpenAIModelul de încorporare al lui , Text Embedding 3 Large. 

Codestral Embed, parte a programului Mistral Familia Codestral de modele de codare, poate face încorporări care transformă codul și datele în reprezentări numerice pentru RAG. 

„Codestral Embed poate genera încorporări cu diferite dimensiuni și precizii, iar figura de mai jos ilustrează compromisurile dintre calitatea regăsirii și costurile de stocare”, a spus Mistral într-o postare pe blog. „Codestral Embed cu dimensiunea 256 și precizia int8 încă are performanțe mai bune decât orice model de la concurenții noștri. Dimensiunile încorporărilor noastre sunt ordonate după relevanță. Pentru orice dimensiune țintă întreagă n, puteți alege să păstrați primele n dimensiuni pentru un compromis ușor între calitate și cost.”

Mistral a testat modelul pe mai multe benchmark-uri, inclusiv SWE-Bench și Text2Code de la GitHub. În ambele cazuri, compania a declarat că Codestral Embed a depășit performanța modelelor de embedding de top. 

SWE- Bancă

Text2Code

Cazuri de utilizare

Mistral a declarat că Codestral Embed este optimizat pentru „recuperarea codului de înaltă performanță” și înțelegerea semantică. Compania a spus că acest cod funcționează cel mai bine pentru cel puțin patru tipuri de cazuri de utilizare: RAG, căutare semantică de cod, căutare de similarități și analiză de cod. 

Modelele de embedding vizează, în general, cazurile de utilizare RAG, deoarece pot facilita o recuperare mai rapidă a informațiilor pentru sarcini sau procese agențice. Prin urmare, nu este surprinzător faptul că Codestral Embed s-ar concentra pe acest aspect. 

Modelul poate efectua, de asemenea, căutare semantică de cod, permițând dezvoltatorilor să găsească fragmente de cod folosind limbaj natural. Acest caz de utilizare funcționează bine pentru platformele de instrumente pentru dezvoltatori, sistemele de documentație și copiloții de codare. Codestral Embed poate ajuta, de asemenea, dezvoltatorii să identifice segmente de cod duplicate sau șiruri de cod similare, ceea ce poate fi util pentru întreprinderile cu politici privind codul reutilizat. 

Modelul acceptă gruparea semantică, care implică gruparea codului în funcție de funcționalitatea sau structura sa. Acest caz de utilizare ar ajuta la analizarea repozitoriilor, la clasificarea și găsirea de modele în arhitectura codului. 

Concurența este în creștere în domeniul integrării

Mistral a fost pe val cu lansarea noi modele și instrumente agențiceA lansat Mistral Medium 3, o versiune medie a modelului său emblematic de limbaj mare (LLM), care în prezent este utilizată pentru platforma sa Le Chat Enterprise, axată pe întreprinderi. 

De asemenea, a anunțat Agents API, care permite dezvoltatorilor să acceseze instrumente pentru crearea de agenți care efectuează sarcini din lumea reală și orchestrează mai mulți agenți. 

Mișcările lui Mistral de a oferi dezvoltatorilor mai multe opțiuni de modele nu au trecut neobservate în spațiile dezvoltatorilor. Unii de pe X remarcă faptul că lansarea Codestral Embed de către Mistral „vine imediat după creșterea concurenței”.

Totuși, Mistral trebuie să demonstreze că Codestral Embed are performanțe bune nu doar în testele comparative. Deși concurează cu modele mai închise, cum ar fi cele de la OpenAI și Cohere, Codestral Embed se confruntă și cu opțiuni open-source de la... Qodo, inclusiv Qodo-Embed-1-1.5 B.

VentureBeat a contactat Mistral în legătură cu opțiunile de licențiere ale Codestral Embed. 

spot_img

cele mai recente articole

explorează mai mult

LĂSAȚI UN MESAJ

Vă rugăm să introduceți comentariul dvs.!
Introduceți aici numele dumneavoastră.

ro_RORomanian