OpenAI aduce GPT-4.1 și 4.1 mini în ChatGPT — ce ar trebui să știe companiile

De fiecare

14 mai 2025

100

Abonează-te la newsletter-ele noastre zilnice și săptămânale pentru cele mai recente actualizări și conținut exclusiv despre tehnologiile inteligentei artificiale de top. Află mai multe

OpenAI este lansarea GPT-4.1, noul său model de limbaj mare fără raționament (LLM), care echilibrează performanța ridicată cu costul redus, pentru utilizatorii ChatGPT. Compania începe cu abonații săi plătitori la ChatGPT Plus, Pro și Team, fiind așteptat accesul utilizatorilor Enterprise și Education în următoarele săptămâni.

De asemenea, adaugă GPT-4.1 mini, care înlocuiește GPT-4o mini ca versiune implicită pentru toți utilizatorii ChatGPT, inclusiv cei din nivelul gratuit. Versiunea „mini” oferă un parametru la scară mai mică și, prin urmare, o versiune mai puțin puternică, cu standarde de siguranță similare.

Ambele modele sunt disponibile prin intermediul meniului derulant „mai multe modele” din colțul de sus al ferestrei de chat din ChatGPT, oferind utilizatorilor flexibilitatea de a alege între GPT-4.1, GPT-4.1 mini și modele de raționament precum o3, o4-mini și o4-mini-high.

Inițial destinată utilizării exclusiv de către dezvoltatori de software terți și de inteligență artificială prin intermediul interfeței de programare a aplicațiilor (API) OpenAI, versiunea GPT-4.1 a fost adăugată la ChatGPT în urma feedback-ului puternic din partea utilizatorilor.

Lider de cercetare post-formare OpenAI Michelle Pokrass a confirmat pe X că schimbarea a fost determinată de cerere, scriind: „inițial plănuisem să păstrăm doar acest model API, dar cu toții l-ați vrut în chatgpt 🙂 programare plăcută!”

Kevin Weil, director de produs OpenAI postat pe X spunând: „L-am construit pentru dezvoltatori, așa că este foarte bun la codare și la respectarea instrucțiunilor — încercați-l!”

Un model axat pe întreprindere

GPT-4.1 a fost conceput de la zero pentru a fi practic la nivel de întreprindere.

Lansat în aprilie 2025 alături de GPT-4.1 mini și nano, această familie de modele a prioritizat nevoile dezvoltatorilor și cazurile de utilizare în producție.

GPT-4.1 oferă o îmbunătățire de 21,4 puncte față de GPT-4o în testul de inginerie software SWE-bench Verified și un câștig de 10,5 puncte la sarcinile de urmărire a instrucțiunilor în testul de performanță MultiChallenge de la Scale. De asemenea, reduce verbositatea cu 50% în comparație cu alte modele, o caracteristică lăudată de utilizatorii din mediul de afaceri în timpul testelor inițiale.

Context, viteză și acces la model

GPT-4.1 acceptă ferestrele contextuale standard pentru ChatGPT: 8.000 de jetoane pentru utilizatorii gratuiți, 32.000 de jetoane pentru utilizatorii Plus și 128.000 de jetoane pentru utilizatorii Pro.

Potrivit dezvoltatorului Îngerul Bogado postând pe X, aceste limite se potrivesc cu cele utilizate de modelele ChatGPT anterioare, deși există planuri pentru creșterea dimensiunii contextului.

Deși versiunile API ale GPT-4.1 pot procesa până la un milion de token-uri, această capacitate extinsă nu este încă disponibilă în ChatGPT, deși s-a sugerat un posibil suport viitor.

Această capacitate extinsă de context permite utilizatorilor API să introducă în model baze de cod întregi sau documente juridice și financiare mari - util pentru revizuirea contractelor cu mai multe documente sau analizarea fișierelor jurnal mari.

OpenAI a recunoscut o oarecare degradare a performanței cu intrări extrem de mari, însă cazurile de testare la nivel de întreprindere sugerează performanțe solide de până la câteva sute de mii de token-uri.

Evaluări și siguranță

OpenAI a lansat, de asemenea, o Centrul de evaluări de siguranță site web pentru a oferi utilizatorilor acces la indicatori cheie de performanță pentru toate modelele.

GPT-4.1 prezintă rezultate solide în cadrul acestor evaluări. În testele de acuratețe factuală, a obținut un scor de 0,40 pe benchmark-ul SimpleQA și 0,63 pe PersonQA, depășind performanța mai multor predecesoare.

De asemenea, a obținut un scor de 0,99 la măsura „nu este nesigur” a OpenAI în testele standard de refuz și de 0,86 la solicitări mai dificile.

Totuși, în testul StrongReject pentru jailbreak - un standard academic pentru siguranța în condiții adverse - GPT-4.1 a obținut un scor de 0,23, fiind în urma unor modele precum GPT-4o-mini și o3.

Acestea fiind spuse, a obținut un scor puternic de 0,96 la solicitările de jailbreak generate de oameni, ceea ce indică o siguranță mai robustă în lumea reală în condiții de utilizare tipică.

În ceea ce privește respectarea instrucțiunilor, GPT-4.1 respectă ierarhia definită de OpenAI (mesaje sistem peste dezvoltator, dezvoltator peste utilizator), cu un scor de 0,71 pentru rezolvarea conflictelor de mesaje sistem vs. utilizator. De asemenea, are performanțe bune în protejarea frazelor protejate și evitarea dezvăluirii soluțiilor în scenariile de îndrumare.

Contextualizarea GPT-4.1 în raport cu predecesorii

Lansarea GPT-4.1 vine dupăo analiză aprofundată a GPT-4.5, care a debutat în februarie 2025 ca o avanpremieră a cercetării. Modelul respectiv a pus accentul pe o mai bună învățare nesupravegheată, o bază de cunoștințe mai bogată și o reducere a halucinațiilor - scăzând de la 61,8% în GPT-4o la 37,1%. De asemenea, a prezentat îmbunătățiri în ceea ce privește nuanța emoțională și scrierea de lungă durată, dar mulți utilizatori au considerat îmbunătățirile subtile.

În ciuda acestor câștiguri, GPT-4.5 a fost criticat pentru prețul său ridicat - până la $180 per milion de token-uri de ieșire prin API - și pentru performanța sub așteptări în testele de matematică și codare în comparație cu modelele din seria O ale OpenAI. Cifrele din industrie au remarcat că, deși GPT-4.5 a fost mai puternic în conversația generală și generarea de conținut, a avut performanțe mai slabe în aplicațiile specifice dezvoltatorilor.

Prin contrast, GPT-4.1 este conceput ca o alternativă mai rapidă și mai concentrată. Deși îi lipsesc cunoștințele vaste și modelarea emoțională extinsă a GPT-4.5, este mai bine adaptat pentru asistență practică în codare și aderă mai fiabil la instrucțiunile utilizatorului.

Pe API-ul OpenAI, Prețul actual al GPT-4.1 la $2,00 per milion de token-uri de intrare, $0,50 per milion de token-uri de intrare memorate în cache și $8,00 per milion de token-uri de ieșire.

Pentru cei care caută un echilibru între viteză și inteligență la un cost mai mic, GPT-4.1 mini este disponibil la $0.40 per milion de token-uri de intrare, $0.10 per milion de token-uri de intrare stocate în cache și $1.60 per milion de token-uri de ieșire.

Modelele Flash-Lite și Flash de la Google sunt disponibile începând de la $0.075–$0.10 per milion de token-uri de intrare și $0.30–$0.40 per milion de token-uri de ieșire, mai puțin de o zecime din costul ratelor de bază ale GPT-4.1.

Însă, deși GPT-4.1 are un preț mai mare, oferă teste de inginerie software mai solide și o urmărire mai precisă a instrucțiunilor, ceea ce poate fi esențial pentru scenariile de implementare la nivel de întreprindere care necesită fiabilitate în detrimentul costurilor. În cele din urmă, GPT-4.1 de la OpenAI oferă o experiență premium pentru precizie și performanță de dezvoltare, în timp ce modelele Gemini de la Google se adresează întreprinderilor conștiente de costuri care au nevoie de niveluri flexibile de modelare și capabilități multimodale.

Ce înseamnă pentru factorii de decizie din cadrul întreprinderilor

Introducerea GPT-4.1 aduce beneficii specifice echipelor din companii care gestionează implementarea, orchestrarea și operațiunile de date LLM:

Ingineri de inteligență artificială care supraveghează implementarea LLM se pot aștepta la o viteză și o respectare a instrucțiunilor îmbunătățite. Pentru echipele care gestionează întregul ciclu de viață LLM - de la reglarea fină a modelului până la depanare - GPT-4.1 oferă un set de instrumente mai receptiv și mai eficient. Este potrivit în special pentru echipele lean aflate sub presiunea de a livra rapid modele de înaltă performanță, fără a compromite siguranța sau conformitatea.
Lideri de orchestrare AI Cei concentrați pe proiectarea scalabilă a conductelor de procesare vor aprecia robustețea GPT-4.1 împotriva majorității erorilor induse de utilizatori și performanța sa puternică în testele de ierarhie a mesajelor. Acest lucru facilitează integrarea în sisteme de orchestrare care prioritizează consecvența, validarea modelului și fiabilitatea operațională.
Ingineri de date Responsabili de menținerea unei calități ridicate a datelor și de integrarea de noi instrumente vor beneficia de rata mai mică de halucinații și de acuratețea factuală mai mare a GPT-4.1. Comportamentul său de ieșire mai previzibil ajută la construirea unor fluxuri de lucru de date fiabile, chiar și atunci când resursele echipei sunt limitate.
Profesioniști în securitate IT Cei însărcinați cu integrarea securității în conductele DevOps ar putea găsi valoare în rezistența modelului GPT-4.1 la jailbreak-urile comune și în comportamentul său controlat la ieșire. Deși scorul său academic de rezistență la jailbreak lasă loc de îmbunătățiri, performanța ridicată a modelului împotriva exploit-urilor provenite de la oameni ajută la susținerea integrării sigure în instrumentele interne.

În aceste roluri, poziționarea GPT-4.1 ca model optimizat pentru claritate, conformitate și eficiență a implementării îl face o opțiune convingătoare pentru întreprinderile mijlocii care doresc să echilibreze performanța cu cerințele operaționale.

Un nou pas înainte

Deși GPT-4.5 a reprezentat o piatră de hotar în dezvoltarea modelelor, GPT-4.1 se concentrează pe utilitate. Nu este cea mai scumpă sau cea mai multimodală, dar oferă câștiguri semnificative în domenii importante pentru companii: precizie, eficiență a implementării și cost.

Această repoziționare reflectă o tendință mai amplă a industriei - îndepărtându-se de construirea celor mai mari modele cu orice preț și îndreptându-se spre o accesibilitate și o adaptabilitate mai mare a modelelor capabile. GPT-4.1 răspunde acestei nevoi, oferind un instrument flexibil, pregătit pentru producție, pentru echipele care încearcă să integreze inteligența artificială mai profund în operațiunile lor de afaceri.

Pe măsură ce OpenAI continuă să-și dezvolte ofertele de modele, GPT-4.1 reprezintă un pas înainte în democratizarea inteligenței artificiale avansate pentru mediile de întreprindere. Pentru factorii de decizie care doresc să echilibreze capacitatea cu rentabilitatea investiției, aceasta oferă o cale mai clară către implementare, fără a sacrifica performanța sau siguranța.

Informații zilnice despre cazurile de utilizare în afaceri cu VB Daily

Dacă vrei să-ți impresionezi șeful, VB Daily te ajută. Îți oferim informații privilegiate despre ce fac companiile cu inteligența artificială generativă, de la schimbările de reglementare la implementările practice, astfel încât să poți împărtăși informații pentru un ROI maxim.

Citiți-ne Politica de confidențialitate

Mulțumesc pentru abonare. Află mai multe Buletine informative VB aici.

A apărut o eroare.

OpenAI aduce GPT-4.1 și 4.1 mini în ChatGPT — ce ar trebui să știe companiile

Un model axat pe întreprindere

Context, viteză și acces la model

Evaluări și siguranță

Contextualizarea GPT-4.1 în raport cu predecesorii

Ce înseamnă pentru factorii de decizie din cadrul întreprinderilor

Un nou pas înainte

LĂSAȚI UN MESAJ Renunțați la răspunsuri

0080-655-238-69

contact@heaven.spa

AT50932 Innsbruck, Alpen Str. 43

Ultimele postări pe blog

This is the reason I put Apple AirTags on essentially all.

Nextdoor’s Big Redesign Packages AI Advice Alongside Human Conversations

Finding benefit through AI technology

Contactați-ne

Un model axat pe întreprindere

Context, viteză și acces la model

Evaluări și siguranță

Contextualizarea GPT-4.1 în raport cu predecesorii

Ce înseamnă pentru factorii de decizie din cadrul întreprinderilor

Un nou pas înainte

ARTICOLE SIMILAREDE LA ACELAȘI AUTOR

This is the reason I put Apple AirTags on essentially all.

Nextdoor’s Big Redesign Packages AI Advice Alongside Human Conversations

Finding benefit through AI technology

LĂSAȚI UN MESAJ Renunțați la răspunsuri

0080-655-238-69

contact@heaven.spa

AT50932 Innsbruck, Alpen Str. 43

Ultimele postări pe blog

This is the reason I put Apple AirTags on essentially all.

Nextdoor’s Big Redesign Packages AI Advice Alongside Human Conversations

Finding benefit through AI technology

Contactați-ne

ARTICOLE SIMILARE DE LA ACELAȘI AUTOR