Încrederea în IA agentivă: De ce echipamentele de joacă ar putea fi pe locul doi?

image

Pe măsură ce agenții IA intră în implementarea în lumea reală, organizațiile sunt sub presiunea de a defini unde le este locul, cum să-i construiască eficient și cum să-i operaționalizeze la scară largă. La VentureBeat Transformă 2025, lideri din domeniul tehnologiei s-au reunit pentru a discuta despre modul în care își transformă afacerile alături de agenți: Joanne Chen, partener general la Foundation Capital; Shailesh Nalawadi, vicepreședinte de management de proiect la Sendbird; Thys Waanders, vicepreședinte senior de transformare a inteligenței artificiale la Cognigy; și Shawn Malhotra, director tehnic, Rocket Companies.

[conținut încorporat]

Câteva cazuri de utilizare de top a inteligenței artificiale agențice

„Atracția inițială a oricăreia dintre aceste implementări pentru agenții IA tinde să fie economisirea capitalului uman - calculele sunt destul de simple”, a spus Nalawadi. „Totuși, acest lucru subestimează capacitatea de transformare pe care o obțineți cu agenții IA.”

La Rocket, agenții de inteligență artificială s-au dovedit a fi instrumente puternice în creșterea conversiilor pe site-uri web.

„Am constatat că, datorită experienței noastre bazate pe agenți, experiența conversațională de pe site-ul web, clienții au de trei ori mai multe șanse să convertească atunci când vin prin acel canal”, a spus Malhotra.

Dar asta e doar o mică parte. De exemplu, un inginer de la Rocket a construit un agent în doar două zile pentru a automatiza o sarcină extrem de specializată: calcularea taxelor de transfer în timpul subscrierii creditului ipotecar.

„Aceste două zile de efort ne-au economisit un milion de dolari pe an în cheltuieli”, a spus Malhotra. „În 2024, am economisit peste un milion de ore de lucru pentru membrii echipei, în mare parte datorită soluțiilor noastre de inteligență artificială. Asta nu înseamnă doar economii de cheltuieli. De asemenea, le permite membrilor echipei noastre să își concentreze timpul asupra oamenilor care fac ceea ce este adesea cea mai mare tranzacție financiară din viața lor.”

Agenții, practic, supraalimentează fiecare membru al echipei. Acel milion de ore economisite nu reprezintă întregul job al cuiva repetat de nenumărate ori. Sunt fracțiuni din job care sunt lucruri pe care angajații nu le fac cu plăcere sau care nu adăugau valoare clientului. Iar acel milion de ore economisite îi oferă Rocket capacitatea de a gestiona mai multe afaceri.

„Unii dintre membrii echipei noastre au reușit să gestioneze cu 50% mai mulți clienți anul trecut decât anul precedent”, a adăugat Malhotra. „Asta înseamnă că putem avea un randament mai mare, putem genera mai multe afaceri și, din nou, observăm rate de conversie mai mari, deoarece aceștia își petrec timpul înțelegând nevoile clientului, în loc să facă mult mai multă muncă mecanică, lucru pe care inteligența artificială îl poate face acum.”

Abordarea complexității agenților

„O parte din parcursul echipelor noastre de inginerie constă în trecerea de la mentalitatea ingineriei software – scrieți-o o dată și testați-o, iar aceasta rulează și oferă același răspuns de 1.000 de ori – la o abordare mai probabilistă, în care întrebați același lucru unui LLM, iar acesta oferă răspunsuri diferite printr-o anumită probabilitate”, a spus Nalawadi. „O mare parte din acest proces a atras oameni. Nu doar ingineri software, ci și manageri de produs și designeri UX.”

„Ceea ce a ajutat este faptul că specialiștii în drept (LLM) au evoluat mult”, a spus Waanders. „Dacă au construit ceva acum 18 luni sau doi ani, trebuiau cu adevărat să aleagă modelul potrivit, altfel agentul nu ar fi performat așa cum se aștepta. Acum, spune el, suntem într-un stadiu în care majoritatea modelelor mainstream se comportă foarte bine. Sunt mai previzibile. Dar astăzi provocarea constă în combinarea modelelor, asigurarea capacității de răspuns, orchestrarea modelelor potrivite în secvența corectă și integrarea datelor corecte.”

„Avem clienți care transmit zeci de milioane de conversații pe an”, a spus Waanders. „Dacă automatizezi, să zicem, 30 de milioane de conversații pe an, cum se scalează asta în lumea LLM? Toate acestea sunt lucruri pe care a trebuit să le descoperim, lucruri simple, de la obținerea disponibilității modelului cu furnizorii de cloud. De exemplu, obținerea unei cote suficiente cu un model ChatGPT. Toate acestea sunt lecții prin care a trebuit să trecem noi, la fel și clienții noștri. Este o lume complet nouă.”

Un nivel superior orchestrării LLM orchestrează o rețea de agenți, a spus Malhotra. O experiență conversațională are o rețea de agenți în interior, iar orchestratorul decide cărui agent să îi transmită solicitarea dintre cei disponibili.

„Dacă abordezi problema dincolo de context și te gândești la sute sau mii de agenți capabili de diferite lucruri, întâmpini niște probleme tehnice cu adevărat interesante”, a spus el. „Devine o problemă și mai mare, deoarece latența și timpul contează. Rutarea agenților va fi o problemă foarte interesantă de rezolvat în următorii ani.”

Accesarea relațiilor cu furnizorii

Până în prezent, primul pas pentru majoritatea companiilor care lansează IA agentică a fost construirea internă, deoarece instrumente specializate nu existau încă. Dar nu poți diferenția și crea valoare prin construirea unei infrastructuri generice LLM sau a unei infrastructuri IA și ai nevoie de expertiză specializată pentru a merge dincolo de construcția inițială și pentru a depana, itera și îmbunătăți ceea ce a fost construit, precum și pentru a întreține infrastructura.

„Adesea, constatăm că cele mai reușite conversații pe care le avem cu potențialii clienți tind să fie cu cineva care a construit deja ceva intern”, a spus Nalawadi. „Își dau seama repede că este în regulă să ajungă la versiunea 1.0, dar pe măsură ce lumea evoluează, pe măsură ce infrastructura evoluează și pe măsură ce trebuie să schimbe tehnologia cu ceva nou, nu au capacitatea de a orchestra toate aceste lucruri.”

Pregătirea pentru complexitatea IA agentială

Teoretic, IA agențică va crește în complexitate - numărul de agenți dintr-o organizație va crește, iar aceștia vor începe să învețe unii de la alții, iar numărul de cazuri de utilizare va exploda. Cum se pot pregăti organizațiile pentru această provocare?

„Înseamnă că mecanismele de control și echilibru din sistemul dumneavoastră vor fi mai solicitate”, a spus Malhotra. „Pentru ceva ce are un proces de reglementare, există o persoană implicată care să se asigure că cineva aprobă acest lucru. Pentru procesele interne critice sau accesul la date, există observabilitate? Există alertele și monitorizarea adecvate, astfel încât, dacă ceva nu merge bine, să știi că merge prost? Este vorba de dublarea detecției, de înțelegerea locului în care este nevoie de o persoană implicată și apoi de încrederea că aceste procese vor detecta dacă ceva merge prost. Dar, datorită puterii pe care o deblochează, trebuie să o faci.”

Deci, cum poți avea încredere că un agent de inteligență artificială se va comporta în mod fiabil pe măsură ce evoluează?

„Partea asta e foarte dificilă dacă nu te-ai gândit la ea de la început”, a spus Nalawadi. „Pe scurt, înainte de a începe să o construiești, ar trebui să ai o infrastructură de evaluare implementată. Asigură-te că ai un mediu riguros în care știi cum arată, din partea unui agent de inteligență artificială, și că ai acest set de teste. Revino la el pe măsură ce faci îmbunătățiri. O modalitate foarte simplistă de a gândi despre evaluare este că este vorba de testele unitare pentru sistemul tău agentic.”

„Problema este că nu este deterministă”, a adăugat Waanders. „Testarea unitară este critică, dar cea mai mare provocare este că nu știi ce nu știi - ce comportamente incorecte ar putea afișa un agent, cum ar putea reacționa într-o anumită situație.”

„Poți afla asta doar simulând conversații la scară largă, testând-o în mii de scenarii diferite și apoi analizând cum rezistă și cum reacționează”, a spus Waanders.

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

ro_RORomanian