OpenAI updates Operator to o3, making its $200 monthly ChatGPT Pro subscription more enticing

Abonează-te la newsletter-ele noastre zilnice și săptămânale pentru cele mai recente actualizări și conținut exclusiv despre tehnologiile inteligentei artificiale de top. Află mai multe

A fost o săptămână importantă pentru anunțurile privind inteligența artificială, în urma evenimentelor de la Microsoft, Google și AnthropicDar OpenAI încheie lucrurile cu propriile noutăți. Și nu, nu vorbim doar despre despre achiziția echipei de design a lui Jony Ive în valoare de 14,6 miliarde de lire sterline a conduce o nou efort hardware, „io” la OpenAI.

Astăzi, Compania și-a modernizat operatorul agent autonom de navigare web și control al cursorului în cadrul ChatGPT, de la utilizarea modelului de limbaj multimodal mare GPT-4o anterior la cel mai nou și mai puternic modelul de raționament o3.

Actualizarea, lansată la nivel global astăzi, 23 mai 2025, este disponibilă ca „previzualizare a cercetării” pentru abonații plătitori ai planului ChatGPT Pro de la OpenAI, cu o plată lunară de $200 USD.

Practic, acesta este modul OpenAI de a spune că nu este încă un produs complet „perfecționat” sau „ameliorat” - s-ar putea să aibă în continuare deficiențe și probleme.

Dar cu rivalul Google oferă în mod regulat propriul pachet de abonament de inteligență artificială de top la un preț de aproape $250 USD (cu o reducere de până la $125 pentru primele trei luni) pentru a accesa cele mai recente modele Gemini multimodale, generare de imagini Imagen și generare video Veo, dintr-o dată planul ChatGPT Pro al OpenAI pare mai accesibil prin comparație.

Ce este Operatorul OpenAI și la ce servește?

Operatorul a debutat pentru prima dată în ianuarie 2025 ca prim pas al OpenAI către agenți semi-autonomi, în special agenți care utilizează computerul (CUA). Ideea este de a depăși interfața chatbot a ChatGPT și de a permite modelelor puternice de inteligență artificială ale OpenAI să înceapă să întreprindă mai multe acțiuni în numele utilizatorului.

Astfel, Operator a fost conceput să indice, să deruleze și să tasteze în mod autonom pentru a finaliza sarcini web, cum ar fi rezervarea cinei, întocmirea listelor de cumpărături sau comandarea biletelor la evenimente. Această capacitate agentială îi permite să îndeplinească sarcinile utilizatorului direct printr-o interfață de browser, de la rezervarea până la colectarea de date online.

Din motive de siguranță, confidențialitate și securitate, Operator nu a folosit niciun browser web existent pe PC-ul sau Mac-ul utilizatorului. În schimb, a rulat într-un browser virtual găzduit în cloud, accesibil prin intermediul unui site independent - operator.chatgpt.com - unde utilizatorii puteau introduce cereri și observa cum agentul efectuează sarcini în timp real.

A combinat capacitățile de viziune, raționament și interacțiune bazate pe GPT-4o, marcând o nouă direcție pentru OpenAI în domeniul inteligenței artificiale agențice.

Produsul a fost lansat ca o previzualizare a cercetării pentru abonații ChatGPT Pro și includea măsuri de siguranță încorporate, cum ar fi confirmările utilizatorilor, modul Vizionare și restricții pe platformele web cu risc ridicat.

De asemenea, a fost testată în contexte de întreprinderi, inclusiv în planificarea călătoriilor și serviciile civice, demonstrându-și potențialul atât în mediile de consum, cât și în cele de afaceri.

o3 oferă precizie, structură și rate de succes îmbunătățite

Cu această actualizare, OpenAI își propune să îmbunătățească performanța în mai multe aspecte cheie. Noul Operator bazat pe o3 demonstrează o persistență și o precizie îmbunătățite în timpul interacțiunilor cu browserul.

În termeni practici, aceasta înseamnă că este mai probabil să finalizeze sarcinile utilizatorului cu succes și cu mai puțină nevoie de corecții sau repetiții. Mai mult, utilizatorii se pot aștepta la răspunsuri mai clare, mai structurate și mai cuprinzătoare.

În evaluările comparative, noul model prezintă un avantaj distinct în ceea ce privește preferințele față de predecesorul său. Studiile privind preferințele umane arată că utilizatorii preferă modelul o3 pentru stilul, complexitatea și claritatea sa. De asemenea, are performanțe excelente în ceea ce privește respectarea instrucțiunilor și eficiența, deși rezultatele privind corectitudinea factuală sunt mai echilibrate între versiuni.

Performanța în ceea ce privește criteriile de evaluare ale unor terțe părți reflectă aceste îmbunătățiri. Pe Benchmark-ul OSWorld care măsoară finalizarea sarcinilor bazate pe browser, modelul o3 obține un scor de 42,9 față de 38,1 pentru versiunea anterioară.

Cu toate acestea, OpenAI observă că, din cauza limitărilor sistemului automat de notare, creșterea reală a performanței ar putea fi mai aproape de 20 de puncte procentuale!

Pe WebArena, noul model a obținut un scor de 62,9, în creștere de la 48,1. Cea mai dramatică îmbunătățire apare în benchmark-ul GAIA, unde modelul o3 obține un scor de 62,2, depășind cu mult scorul de 12,3 al modelului anterior.

Comparațiile sarcinilor comparative ilustrează în continuare aceste câștiguri. Într-un exemplu care implică o cerere de rezervare la restaurant, noul model a oferit o listă mai clară și mai detaliată a rezervărilor disponibile, inclusiv locații, evaluări Michelin și notițe despre locuri, prezentate într-un tabel bine formatat. Versiunea anterioară, deși funcțională, oferea mai puține informații într-un mod mai puțin organizat, conform unei imagini incluse în model. Note de lansare pentru noile o3 Operator:

Măsurile de siguranță rămân valabile, la fel ca și notele generale de precauție privind utilizarea tranzacțiilor financiare sensibile și accesul la cont.

Modelul o3 moștenește, de asemenea, măsurile de siguranță introduse în versiunile anterioare, cu perfecționare suplimentară a rolului său de sistem agentiv.

OpenAI a integrat o instruire îmbunătățită împotriva executării dăunătoare a sarcinilor, a vulnerabilităților de tip prompt injection și a erorilor care implică intenția utilizatorului.

Evaluările arată că modelul confirmă acum 94% de acțiuni sensibile înainte de a le executa, cu 100% de confirmare în tranzacțiile financiare. Susceptibilitatea la injectarea promptă a scăzut, de asemenea, de la 23% la 20%.

În special, Operatorul o3 menține o limită precaută în ceea ce privește anumite interacțiuni web cu risc ridicat, cum ar fi e-mailul sau platformele financiare, unde poate solicita supravegherea utilizatorului prin intermediul Modului Vizionare sau poate refuza în mod explicit să continue. Aceste măsuri fac parte dintr-o abordare stratificată a siguranței care combină robustețea la nivel de model cu monitorizarea în timp real.

Deși actualizarea la Operator marchează o îmbunătățire tehnică, aceasta reflectă și angajamentul continuu al OpenAI față de implementarea responsabilă a inteligenței artificiale.

Capacitatea sistemului de a întreprinde acțiuni în lumea reală introduce noi riscuri, iar echipa de dezvoltare continuă să își perfecționeze protocoalele de siguranță în consecință.

Conform Documentația actualizată a plăcii de sistem o3 de la OpenAI, modelul rămâne sub pragurile de capacitate cu risc ridicat în categorii precum utilizarea abuzivă biologică și chimică și nu are un mediu de codare nativ sau acces la terminal, reducând și mai mult potențialii vectori de utilizare abuzivă.

Operatorul rămâne o previzualizare a cercetării și este accesibil numai utilizatorilor ChatGPT Pro. Versiunea API a Operatorului pentru Responses va continua să se bazeze pe modelul GPT-4o, cel puțin deocamdată.

Implicații pentru factorii de decizie tehnică din cadrul întreprinderilor

Versiunea actualizată a Operatorului va îmbunătăți semnificativ fluxurile de lucru ale profesioniștilor din ingineria inteligenței artificiale, orchestrare, managementul datelor și securitatea IT.

Pentru cei care construiesc sau întrețin modele de învățare automată, precizia îmbunătățită și rezultatele structurate ale modelului reduc costurile de validare a testelor și depanare.

În contexte de orchestrare, oferă un instrument practic și fiabil pentru automatizarea componentelor bazate pe browser ale conductelor complexe.

Inginerii de date pot delega interacțiunile web manuale - cum ar fi verificarea și extragerea datelor - cu mai multă încredere, eliberând timp pentru lucrări de optimizare la nivel superior.

Între timp, profesioniștii în domeniul securității beneficiază de o modalitate mai sigură de a simula comportamentul utilizatorilor în audituri și exerciții de răspuns la incidente, datorită mecanismelor de siguranță stratificate ale modelului.

În aceste discipline, Operatorul bazat pe o3 introduce atât o actualizare a capacității, cât și un cadru de atenuare a riscurilor, ceea ce îl face un plus practic la setul de instrumente tehnice moderne.

Informații zilnice despre cazurile de utilizare în afaceri cu VB Daily

Dacă vrei să-ți impresionezi șeful, VB Daily te ajută. Îți oferim informații privilegiate despre ce fac companiile cu inteligența artificială generativă, de la schimbările de reglementare la implementările practice, astfel încât să poți împărtăși informații pentru un ROI maxim.

Citiți-ne Politica de confidențialitate

Mulțumesc pentru abonare. Află mai multe Buletine informative VB aici.

A apărut o eroare.

OpenAI actualizează Operator la o3, făcând abonamentul lunar ChatGPT Pro $200 mai atractiv.

Ce este Operatorul OpenAI și la ce servește?

o3 oferă precizie, structură și rate de succes îmbunătățite

Măsurile de siguranță rămân valabile, la fel ca și notele generale de precauție privind utilizarea tranzacțiilor financiare sensibile și accesul la cont.

Implicații pentru factorii de decizie tehnică din cadrul întreprinderilor

cele mai recente articole

Dyson prezintă o viziune agricolă modernă

Dyson prezintă un videoclip cu o viziune modernă asupra plantării

Golful individual: navigarea sensului și identității în era inteligenței artificiale

Sugestii, răspunsuri și ajutor de astăzi de la NYT Connections, 14 iulie, #764

Sugestiile, răspunsurile și asistența NYT Strands pentru 14 iulie, TP5T 498, de astăzi sunt disponibile.

Astăzi &#039, sugestii, răspunsuri și ajutor Wordle pentru 14 iulie, # 1486

explorează mai mult

Dyson prezintă o viziune agricolă modernă

Dyson prezintă un videoclip cu o viziune modernă asupra plantării

Golful individual: navigarea sensului și identității în era inteligenței artificiale

Sugestii, răspunsuri și ajutor de astăzi de la NYT Connections, 14 iulie, #764

Sugestiile, răspunsurile și asistența NYT Strands pentru 14 iulie, TP5T 498, de astăzi sunt disponibile.

Astăzi &#039, sugestii, răspunsuri și ajutor Wordle pentru 14 iulie, # 1486

LĂSAȚI UN MESAJ Renunțați la răspunsuri

cele mai vizualizate

Dyson prezintă o viziune agricolă modernă

Dyson prezintă un videoclip cu o viziune modernă asupra plantării

Golful individual: navigarea sensului și identității în era inteligenței artificiale

în tendințe acum

Dyson prezintă o viziune agricolă modernă

Dyson prezintă un videoclip cu o viziune modernă asupra plantării

Golful individual: navigarea sensului și identității în era inteligenței artificiale

Sugestii, răspunsuri și ajutor de astăzi de la NYT Connections, 14 iulie, #764

Sugestiile, răspunsurile și asistența NYT Strands pentru 14 iulie, TP5T 498, de astăzi sunt disponibile.

Astăzi &#039, sugestii, răspunsuri și ajutor Wordle pentru 14 iulie, # 1486