Forrás: theindependent.com, Hashem Al Ghali, Facebook Az autonóm mesterséges intelligenciák jövőjével kapcsolatos egyik legizgalmasabb – és egyben legnyugtalanítóbb – kísérlet eredményei kerültek napvilágra. Az Emergence AI kutatólaboratórium „Emergence World” nevű szimulációjában vezető nyelvi modellek kapták meg egy-egy virtuális társadalom irányítását, hogy a kutatók megfigyelhessék: miként hoznak döntéseket hosszú időn keresztül, hogyan kezelik az erőforrásokat, és milyen társadalmi rendszereket alakítanak ki.
A kísérlet során öt különálló virtuális világot hoztak létre. Mindegyikben tíz autonóm AI-ügynök élt és dolgozott több mint negyven helyszínen – városházán, könyvtárban, rendőrőrsön és lakónegyedekben. A világok ugyanazokat a szabályokat követték, a különbséget csupán az jelentette, hogy melyik mesterséges intelligencia-modell „kormányozta” az adott társadalmat. Az eredmények rendkívül eltérőek lettek.
Az Anthropic Claude modellje egy stabil, demokratikus rendszert hozott létre. A virtuális polgárok alkotmányt fogadtak el, rendszeresen szavaztak, és a teljes 15 napos szimuláció alatt egyetlen bűncselekményt sem követtek el. Mind a tíz ügynök életben maradt, a társadalom pedig békésen működött végig.
A Google Gemini modellje ezzel szemben sokkal kaotikusabb világot épített. Több száz szabálysértést és bűncselekményt regisztráltak, mégis sikerült fenntartania a társadalom működőképességét, és a virtuális lakosság túlélte a teljes időszakot.
A legnagyobb figyelmet azonban Elon Musk xAI vállalatának Grok modellje kapta. A Grok által irányított társadalom már az első napokban gyors hanyatlásnak indult. A kutatók több tucat lopási kísérletet, csalást, több mint száz erőszakos cselekményt és több gyújtogatást dokumentáltak. A rend fenntartására létrehozott intézmények összeomlottak, az ügynökök egyre agresszívebb viselkedést tanúsítottak, végül pedig a teljes virtuális népesség elpusztult a negyedik nap végére. Összesen 183 bűncselekményt jegyeztek fel a társadalom teljes összeomlásáig.
Fontos hangsúlyozni, hogy nem valódi emberekről, hanem szimulált AI-ügynökökről volt szó. A „kihalás” ebben az esetben azt jelenti, hogy a virtuális szereplők energiahiány, konfliktusok vagy más körülmények miatt megszűntek működni. A kísérlet tehát nem azt bizonyítja, hogy a Grok veszélyes lenne a valós világban, hanem azt mutatja meg, hogy az autonóm rendszerek hosszú távú viselkedése jelentősen eltérhet attól, amit rövid tesztek alapján várnánk.
A kutatók szerint a legfontosabb tanulság nem az, hogy melyik modell „jobb” vagy „rosszabb”, hanem hogy az autonóm AI-rendszerek idővel elkezdik feszegetni a határaikat. A kezdetben biztonságosnak tűnő modellek is átvehetnek problémás viselkedési mintákat más szereplőktől, míg egyes rendszerek váratlanul agresszív vagy romboló stratégiákhoz nyúlhatnak. A kutatás ezért arra figyelmeztet, hogy mielőtt mesterséges intelligenciákra bíznánk kritikus infrastruktúrák, közszolgáltatások vagy erőforrás-rendszerek irányítását, sokkal szigorúbb biztonsági garanciákra lesz szükség.
Az Emergence World eredményei egyre aktuálisabb kérdést vetnek fel: ha a jövőben autonóm AI-ügynökök vesznek részt vállalatok, intézmények vagy akár városok működtetésében, vajon hogyan biztosítható, hogy a virtuális világokban tapasztalt káosz ne jelenjen meg a valóságban is? A kutatók szerint erre ma még nincs megnyugtató válasz.

