Bright Data a învins Elon Musk și Meta în instanță - acum platforma sa de inteligență artificială $100M se confruntă cu marile companii de tehnologie

Alătură-te evenimentului în care liderii companiilor au încredere de aproape două decenii. VB Transform reunește oamenii care construiesc o strategie reală de inteligență artificială pentru companii. Află mai multe


Date luminoase, compania israeliană de extragere a datelor web care i-a învins atât pe Meta, cât și pe X-ul lui Elon Musk a dezvăluit miercuri, într-un tribunal federal, o suită cuprinzătoare de infrastructură de inteligență artificială, concepută pentru a oferi sistemelor de inteligență artificială acces nelimitat la date web în timp real - o capacitate pe care compania susține că platformele Big Tech încearcă să o monopolizeze.

Anunțul de Căutare profundă, Browser.ai...și protocoalele îmbunătățite de colectare a datelor reprezintă o expansiune dramatică pentru compania cu o vechime de un deceniu, care s-a transformat dintr-un serviciu specializat de extragere a datelor web în ceea ce CEO-ul Or Lenchner numește „un strat unic de infrastructură pentru companiile de inteligență artificială”. Această mișcare vine în contextul în care companiile de inteligență artificială se luptă din ce în ce mai mult să acceseze informațiile web actuale necesare pentru a alimenta chatboții, agenții autonomi și alte aplicații de inteligență artificială.

„Inteligența programelor de masterat în drept de astăzi nu mai este factorul lor limitativ; accesul este”, a declarat Lenchner într-un interviu exclusiv acordat VentureBeat. „Am petrecut ultimul deceniu luptând pentru acces liber la datele web publice, iar aceste noi oferte ne duc la următorul capitol din călătoria noastră, unul caracterizat de date cu adevărat accesibile și de creșterea ulterioară a agenților conștienți de context.”

Lansarea vine în urma acțiunii Bright Data victorii juridice de profil înalt în 2024, când judecătorii federali au respins procesele ambelor Meta şi X susținând că firma le-a extras ilegal platformele. Aceste hotărâri au stabilit un precedent juridic crucial care definește ce constituie „date publice„pe internet — informații care pot fi vizualizate fără a fi nevoie de conectare și, prin urmare, pot fi colectate și utilizate în mod legal.”

Cazurile judiciare au arătat că ambele Meta şi X fusese Date luminoase clienților chiar și în timp ce dădeau compania în judecată, subliniind poziția contradictorie pe care mulți giganți tehnologici au adoptat-o față de extragerea de date web. Hotărârile au implicații mai ample pentru industria inteligenței artificiale, care se bazează în mare măsură pe datele web pentru a antrena și opera modele lingvistice.

„În instanță s-a dezvăluit că amândoi erau clienți Bright Data, deoarece toată lumea are nevoie de date, toată lumea, în special cei care construiesc modele”, a explicat Lenchner. „Suntem singura companie care are resursele financiare și aș spune chiar curajul de a face asta.”

Judecătorul William Alsup, care a prezidat cazul X, a scris că acordarea companiilor de socializare „libertății de a decide, pe orice bază, cine poate colecta și utiliza date” riscă să creeze „monopoluri informaționale care ar deservi interesul public”. Hotărârea a stabilit că datele vizibile fără acreditări de conectare constituie informații publice care pot fi extrase legal.

Bright Data a depus acum o cerere contraproces împotriva lui X, susținând că platforma a încălcat legile antitrust prin încercarea de a crea un monopol asupra datelor în beneficiul companiei de inteligență artificială a lui Musk, xAI. „Singurul motiv pentru care X încearcă să împiedice Bright Data să le permită clienților săi să extragă informații din X este că vor fi singura entitate care se va putea bucura de datele relevante și de calitate pe care le produce X”, a spus Lenchner.

Deep Lookup și Browser.ai vizează companiile de inteligență artificială care se confruntă cu dificultăți de acces la date

Noile produse ale companiei abordează ceea ce Lenchner identifică ca fiind cele trei cerințe de bază pentru sistemele de inteligență artificială: algoritmi, putere de calcul și acces la date. Deși Date luminoase nu dezvoltă algoritmi de inteligență artificială și nu oferă resurse de calcul, ci își propune să devină soluția definitivă pentru a treia cerință.

Căutare profundă funcționează ca un motor de cercetare în limbaj natural, conceput pentru a răspunde la întrebări de afaceri complexe, cu mai multe straturi, în timp real. Spre deosebire de motoarele de căutare generale sau de chatboții cu inteligență artificială care oferă rezumate, Deep Lookup se specializează în rezultate complete pentru interogări care încep cu „găsește tot”. De exemplu, utilizatorii pot solicita „toate companiile de transport maritim care au trecut prin canalele Panama și Suez în 2023, ale căror venituri în trimestrul 3 au scăzut cu peste 2%.

Sistemul se bazează pe arhiva web masivă a Bright Data, care conține în prezent peste 200 de miliarde de pagini HTML și adaugă 15 miliarde lunar. Până anul viitor, se așteaptă ca arhiva să depășească 500 de miliarde de pagini. „Nu sunt doar pagini web aleatorii, ci este de fapt ceea ce contează pentru întreaga lume, deoarece cei 20.000 de clienți ai noștri reprezintă miliarde de utilizatori de internet”, a remarcat Lenchner.

Browser.ai reprezintă ceea ce compania numește „primul browser din industrie, neblocabil, nativ pentru inteligență artificială”. Conceput special pentru agenții autonomi de inteligență artificială, serviciul bazat pe cloud imită comportamentul uman pentru a accesa site-uri web fără a declanșa sisteme de detectare a roboților. Acesta acceptă comenzi în limbaj natural și poate efectua interacțiuni web complexe, cum ar fi rezervarea de bilete de avion sau efectuarea de rezervări la restaurant.

Infrastructura browserului procesează deja peste 150 de milioane de acțiuni web zilnic, potrivit companiei. „Aproape toți sunt clienți”, a spus Lenchner despre companiile de agenți de inteligență artificială care au strâns fonduri semnificative. „Pentru că ceea ce am descoperit noi, și au descoperit și ei, este că rezolvăm problema de a intra pe un site web fără a fi blocat și de a executa acțiuni web pe site.”

Servere MCP (Model Context Protocol) oferă un strat de control cu latență redusă care permite agenților de inteligență artificială să caute, să acceseze cu crawlere și să extragă date în timp real. Protocolul permite dezvoltatorilor să construiască sisteme de inteligență artificială care pot acționa pe baza informațiilor actuale, în loc să se bazeze exclusiv pe datele de antrenament.

Portofoliul de brevete și rețeaua de proxy creează o barieră competitivă împotriva blocării

Avantajul competitiv al Bright Data provine din ceea ce Lenchner descrie ca o „obsesie” pentru depășirea mecanismelor de blocare a site-urilor web. Compania deține peste 5.500 de brevete pentru tehnologia sa și operează cea mai mare rețea proxy din lume, cu peste 150 de milioane de adrese IP în 195 de țări.

„Avem o perspectivă atât de bună asupra internetului”, a explicat Lenchner. „De mult timp cartografiem internetul și, de mult timp, arhivăm și porțiuni mari din acesta.”

Abordarea companiei implică tehnici sofisticate de imitare a comportamentului uman, folosind dispozitive reale, adrese IP și amprente de browser, în loc de simple scripturi automate. Acest lucru face ca detectarea și blocarea site-urilor web să fie extrem de dificile.

„Singura modalitate de a ne bloca, practic, este să plasăm datele în spatele autentificării, iar apoi nici nu vom încerca”, a spus Lenchner. „Uneori există o nouă logică de blocare pe care nu o vom rezolva imediat. Echipei noastre de cercetare îi va lua 12 ore, cel mult trei zile, până o vom debloca.”

Veniturile depășesc $100 de milioane, pe măsură ce cererea de inteligență artificială explodează după ChatGPT

În timp ce Date luminoase rămâne deținută în mod privat de o firmă de capital privat, a confirmat Lenchner pentru VentureBeat că veniturile anuale recurente ale companiei depășesc semnificativ $100 milioane. Afacerea a cunoscut o creștere explozivă de la lansarea ChatGPT la sfârșitul anului 2022, pe măsură ce companiile de inteligență artificială s-au grăbit să acceseze date de instruire și informații în timp real.

„Începând cu martie 2023, cam din perioada în care GPT-3 a schimbat lumea, cazul de utilizare al inteligenței artificiale, sau ceea ce numim noi datele pentru inteligență artificială, a explodat complet pentru noi ca și companie”, a spus Lenchner. „Toate celelalte aspecte sunt, de asemenea, în creștere, pentru că toată lumea are nevoie de mai multe date, punct. Dar acest caz de utilizare este complet diferit de orice am mai văzut până acum.”

Compania deservește peste 20.000 de afaceri, inclusiv companii din topul Fortune 500 și laboratoare importante de inteligență artificială. Printre clienții tradiționali se numără platforme de comerț electronic care urmăresc prețurile concurenței, firme de servicii financiare care caută informații de piață și întreprinderi care efectuează cercetări de afaceri.

Conformitatea cu GDPR și practicile etice se diferențiază de concurență

Date luminoase a investit masiv în infrastructura de conformitate pentru a aborda preocupările legate de confidențialitate legate de colectarea datelor. Compania urmează GDPR-ul european şi CCPA din California reglementări, notificând automat persoanele atunci când informațiile lor personale sunt colectate din surse publice și oferind opțiuni de ștergere.

„Regulamentul și legislația sunt clare de când au intrat în vigoare GDPR-ul european și cel puțin reglementările din California și CCPA”, a explicat Lenchner. „Dacă am colectat adresa dvs. de e-mail, de exemplu, vă vom trimite automat un e-mail în care vă vom spune: «Hei, iată cine suntem. Am colectat informațiile dvs. personale din domeniul public. Iată un buton imens pe care puteți da clic dacă doriți să le revizuiți și, evident, puteți solicita ștergerea lor.»”

Compania are o echipă numeroasă de conformitate și o documentație extinsă a practicilor sale, ceea ce s-a dovedit valoros în timpul procedurilor judiciare. „Nouă, întreprinderile, ne apreciază în mod special pentru că avem o poziție etică care a fost examinată de două ori în instanțele americane”, a spus Lenchner.

Războaiele pentru accesul la web se intensifică, pe măsură ce giganții tehnologici caută monopoluri asupra datelor

Bătălia privind accesul la datele web reflectă tensiuni mai ample în industria inteligenței artificiale legate de controlul informațiilor și avantajul competitiv. Pe măsură ce sistemele de inteligență artificială devin mai sofisticate, accesul la date web actuale și complete devine din ce în ce mai valoros - și controversat.

Lenchner prezice că internetul va deveni „mai închis” în timp, similar modului în care Google își menține accesul exclusiv la capacitățile de crawling web, în timp ce alții trebuie să utilizeze servicii alternative. „Câțiva giganți tehnologici vor avea acces gratuit la fiecare site web prin intermediul agenților lor”, a spus el. „Restul vor trebui să utilizeze infrastructura noastră sau infrastructura altcuiva.”

Compania observă, de asemenea, noi tendințe, inclusiv companii care utilizează chatbot-uri bazate pe inteligență artificială în scopuri de marketing și apariția unor noi protocoale precum MCP, care permit agenților inteligenței artificiale să interacționeze mai eficient cu serviciile web.

„Toți acești tipi care consumă cantități masive de date, și cu toții îi folosim, totul contribuie la dezvoltarea creierului roboților”, a spus Lenchner. „E în regulă să ai un chatbot care vorbește cu un om, pentru că asta va face în cele din urmă un robot.”

Creierele robotice și economia agenților conduc următoarea fază a creșterii

Transformarea Bright Data de la serviciu de extragere de date web la furnizor de infrastructură AI reflectă nevoile în rapidă evoluție ale industriei inteligenței artificiale. Pe măsură ce companiile se grăbesc să implementeze agenți AI și sisteme autonome, accesul la date web în timp real devine la fel de crucial ca puterea de calcul și sofisticarea algoritmilor.

Precedentele juridice stabilite prin victoriile în instanță ale Bright Data s-ar putea dovedi la fel de semnificative ca inovațiile sale tehnice, putând modela modul în care întreaga industrie a inteligenței artificiale accesează și utilizează informațiile web. Având în vedere că principalele platforme tehnologice restricționează din ce în ce mai mult accesul la date, dezvoltându-și simultan propriile sisteme de inteligență artificială, furnizorii independenți de infrastructură precum Bright Data ar putea deveni esențiali pentru menținerea echilibrului competitiv în ecosistemul inteligenței artificiale.

„Suntem o companie de infrastructură”, a subliniat Lenchner. „Suntem ingineri foarte talentați care aproape că nu merg nicăieri, doar stau cu computerele și scriu cod. O facem bine. Nu avem intenția să facem altceva.”

Cel/Cea/Cei/Cele Căutare profundă Versiunea beta va fi lansată marți pentru clienții business, accesul publicului larg fiind disponibil printr-o listă de așteptare. Browser.ai şi Servere MCP sunt deja disponibile clienților enterprise prin intermediul platformei existente a Bright Data.

Lasă un comentariu

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

ro_RORomanian