Hírek / AI Vállalatok / Google DeepMind EVE Online: 120 milliós AI-tesztpálya épül

Google DeepMind EVE Online: 120 milliós AI-tesztpálya épül

A Google DeepMind EVE Online partnersége az egyik legérdekesebb AI-kutatási lépés 2026-ban. A DeepMind 120 millió dolláros tranzakcióval kapcsolódik a 23 éve futó EVE Online univerzumhoz, hogy olyan környezetben tesztelje az AI-ügynököket, ahol a tervezés, memória, szövetségek, árulások és gazdasági döntések egyszerre számítanak.

A hivatalos konstrukció szerint a DeepMind kisebbségi részesedést szerzett a CCP Games-ből kivált, Fenris Creations néven működő izlandi stúdióban. A cél nem egy új játékfunkció, hanem kutatási infrastruktúra: az EVE Online komplex univerzumát AI-tesztpályaként használni.

Google DeepMind EVE Online: miért különleges ez a tesztpálya?

Az EVE Online nem klasszikus videojáték-labor. Több mint két évtizede működő, játékosok által formált gazdasági és politikai világ, ahol a döntéseknek hosszú távú következménye van. A játékban szövetségek épülnek, háborúk indulnak, vállalati struktúrák alakulnak, és egy rossz döntés akár több százezer dollárnyi virtuális vagyon elvesztéséhez vezethet.

A DeepMind számára ez azért értékes, mert az AI-ügynökök mai gyengeségei pont ilyen környezetben látszanak igazán. Egy modell meg tud oldani egy kódolási feladatot vagy sakkállást, de sokkal nehezebb éveken átívelő szociális, stratégiai és gazdasági folyamatban jól dönteni.

Az EVE Online azért erős AI-tesztpálya, mert nem egy puzzle-t ad a modellnek, hanem egy élő, ellenséges és hosszú távú világot.

5 kutatási probléma, amit az EVE kiélez

A DeepMind számára az EVE Online öt területen ad különösen erős tesztkörnyezetet:

  1. Hosszú távú tervezés: hónapokon át tartó háborúk, logisztikai döntések és szövetségi stratégiák kezelése.
  2. Memória: régi konfliktusok, adósságok, árulások és politikai kapcsolatok visszatartása több időtávon.
  3. Folyamatos tanulás: flottadoktrínák, piaci stratégiák és hadműveleti minták módosítása vereségek után.
  4. Szociális stratégia: tárgyalás, bizalomépítés, megtévesztés és koalíciók kezelése emberi játékosok között.
  5. Gazdasági döntéshozatal: nyersanyag, ipari termelés, kereskedelem és kockázatkezelés összekapcsolása.

A B-R5RB csata mutatja, miért nehéz ez az AI-nak

Az EVE Online legismertebb példája a B-R5RB vérfürdője. A 21 órás csatában 7548 játékos vett részt, 75 Titan-osztályú csatahajó semmisült meg, a pusztítás valós pénzben becsült értéke pedig 300–330 ezer dollár körül mozgott.

A történet azért fontos, mert a konfliktus egyetlen rutinszerű adminisztratív hibából indult: egy játékos elfelejtett befizetni egy szuverenitási számlát. Ez jól mutatja, milyen típusú problémát jelent az EVE. Nem csak taktikai ügyesség kell, hanem memória, folyamatfegyelem, társadalmi koordináció és hosszú távú következmények megértése.

Kevés AI-benchmark teszteli ezt a kombinációt. Az EVE-ben egy apró mulasztás láncreakciót indíthat, amelyet több ezer ember és több hónapnyi stratégiai előzmény alakít.

Hogyan tanulhat az AI az EVE világában?

A DeepMind módszertana a korábbi játékos kutatások logikájára épül. Az ügynök nem közvetlenül a játék belső állapotát kapja meg, hanem pixelstreamből és játékbeli megfigyelésekből dolgozik. Ez közelebb áll az emberi játékos helyzetéhez, mint egy tökéletes információt adó szimuláció.

A kezdeti kutatás kontrollált, offline környezetben fut, nem az élő Tranquility szerveren. Ez fontos döntés, mert így a DeepMind nem avatkozik bele közvetlenül az EVE valós játékosgazdaságába, és nem borítja fel a versenyintegritást.

Az offline másolatok lehetővé teszik, hogy ugyanazt a konfliktust többször lefuttassák, különböző AI-stratégiákkal. Így mérhető, hogyan reagál az ügynök vereségre, információhiányra, megtévesztésre vagy váratlan piaci mozgásra.

Az Ataritól az EVE-ig vezet a DeepMind útja

A DeepMind hosszú ideje használ játékokat AI-kutatási környezetként. Az Atari DQN, az AlphaGo, az AlphaStar és a SIMA mind azt mutatta, hogy a játékok kontrollált, de egyre bonyolultabb tesztpályát adnak az AI-rendszereknek.

Az EVE Online ebben a sorban új szint. Az Atari rövid epizódokra épült, a Go zárt szabályrendszerre, a StarCraft valós idejű stratégiára, a SIMA több 3D környezetben működő ügynökre. Az EVE viszont tartós szociális és gazdasági világ, amelyben a múltbeli döntések évekkel később is számítanak.

Ez különösen fontos az agentikus AI fejlődésében. A következő generációs ügynököknek nem csak eszközt kell hívniuk vagy tervet írniuk, hanem hosszú időn át kell követniük célokat, miközben más szereplők aktívan próbálják őket félrevezetni.

A 120 millió dolláros deal üzleti jelentése

A tranzakció három részből áll. A Pearl Abyss, amely korábban 425 millió dollárért vásárolta meg a CCP Games-t, 120 millió dolláros ügyletben adta vissza a stúdiót a menedzsmentnek és hosszú távú befektetőknek. Az új cég Fenris Creations néven működik, saját igazgatótanáccsal.

A Google kisebbségi részesedést szerzett a Fenrisben, a DeepMind pedig kutatási hozzáférést kap az EVE univerzumhoz. Ez nem hagyományos gaming befektetés. A DeepMind valójában olyan AI-kutatási környezethez jut, amelyet laborban szinte lehetetlen lenne újraépíteni.

Ez a modell kapcsolódik ahhoz a trendhez, amelyben a nagy AI-cégek egyre több speciális tesztkörnyezetet keresnek az agentikus rendszerekhez. A Google AGI-mérési keretrendszeréről szóló cikkünkben is ezt láttuk: a vita a modellek általános képességeinek mérésére tolódik.

Miért számít ez az AI-ügynökök jövőjének?

A Google DeepMind EVE Online partnersége azért fontos, mert az AI-ügynökök következő nagy kérdése nem az, hogy tudnak-e feladatlistát végrehajtani. Az igazi kérdés az, hogy képesek-e hosszú távú célokat tartani, memóriát építeni, tanulni vereségből, és más szereplők ellenében stratégiát váltani.

Ha egy AI az EVE világában működőképesen tud tervezni, az túlmutat a videojátékokon. Ugyanezek a képességek fontosak lehetnek pénzügyi piacokon, ellátási láncokban, kiberbiztonságban, logisztikában és vállalati stratégiai rendszerekben.

A 120 millió dolláros AI-tesztpálya ezért nem játékos mellékszál. Ez a DeepMind egyik legkomolyabb kísérlete arra, hogy az AI-ügynököket ne rövid benchmarkokban, hanem hosszú, élő, stratégiai környezetben tegye próbára.

Kapcsolódó elemzésünkben azt is bemutatjuk, hogyan méri a Google az általános AI-képességeket: AGI-mérés Google-módra: 10 képesség döntheti el a haladást.

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük