A mesterséges intelligencia kiberbiztonsági alkalmazásának régóta várt, de egyben tartott mérföldköve megérkezett. A Google Threat Intelligence Group (GTIG) a hét elején publikált jelentésében megerősítette az első valós esetet, amelyben egy kiberbűnözői csoport sikeresen alkalmazott egy AI modellt egy eddig ismeretlen, úgynevezett nulladik napi (zero-day) sebezhetőség felfedezésére és egy működő exploit megírására. A célpont egy népszerű, nyílt forráskódú adminisztrációs eszköz volt, a támadás pedig a kétfaktoros hitelesítés (2FA) megkerülését tette lehetővé.
Bár a hírek szerint az érintett szoftver gyártója azóta javította a hibát, az incidens jelentősége túlmutat egyetlen sebezhetőségen. John Hultquist, a GTIG vezető elemzője szerint:
„Őszintén szólva, ennek az eseménynek a részletei nem annyira fontosak, mint a bizonyíték, hogy az ellenfelek általi felhasználás korszaka itt van.”
Ez a kijelentés egy új fejezetet nyit a kiberhadviselésben, ahol a támadók és a védők egyaránt AI-eszközöket vetnek be.
A bizonyíték: AI által generált kód árulkodó jelei
A Google kutatói „magas fokú biztossággal” állítják, hogy egy AI modell segített a hiba megtalálásában és kihasználásában. A bizonyosságukat több árulkodó jelre alapozták, amelyeket a Python nyelven írt exploit kódjában fedeztek fel. A kód formázása „tankönyvi” volt, a súgó menüket pedánsan kidolgozták, és a dokumentációban egy „hallucinált”, azaz a modell által kitalált, valóságban nem létező CVSS súlyossági pontszám is szerepelt. Ezek a jellemzők együttesen egyértelműen egy nyelvi modell közreműködésére utaltak.
A Google kizárta a saját Gemini és az Anthropic Mythos modelljeinek érintettségét, ami azt jelenti, hogy a támadók egy másik, potenciálisan kevésbé korlátozott vagy akár saját fejlesztésű modellt használhattak. Ez rávilágít arra a problémára, hogy míg a nagy technológiai cégek igyekeznek biztonsági korlátokat beépíteni a modelljeikbe, a nyílt forráskódú vagy rosszindulatú célra finomhangolt AI-k korlátlan lehetőségeket biztosíthatnak a támadóknak.
Nem elszigetelt eset: Állami szereplők is fegyverkeznek
A GTIG jelentése egyértelművé teszi, hogy ez nem egy magányos kiberbűnözői csoport kísérletezgetése. A 2026-os évben már tendenciaszerűvé vált, hogy állami hátterű csoportok is aktívan használják az AI-t támadó célokra. A jelentés kiemeli a Kínához és Észak-Koreához köthető szereplőket, akik mesterséges intelligenciát vetnek be sebezhetőségek felkutatására, személyre szabott „jailbreak” technikák kidolgozására és exploitok tömeges validálására.
Konkrét példák is szerepelnek a dokumentumban:
- Az APT45 nevű, észak-koreai csoporthoz köthető támadók több ezer ismétlődő promptot küldtek AI modelleknek, hogy meglévő proof-of-concept exploitok működőképességét validálják.
- Egy feltételezhetően Kínához köthető csoport hamis biztonsági kutatói perszónákat használva hajtott végre „jailbreak” támadást a Gemini modellen, hogy TP-Link routerekben keressen sebezhetőségeket.
Ezek a tevékenységek azt mutatják, hogy a támadók már nemcsak kísérleteznek, hanem szisztematikusan integrálják az AI-t a támadási láncba, a felderítéstől a fegyverré alakításig.
AIQ-elemzés: Mit jelent ez a magyar és EU-s vállalatok számára?
Az AIQ szerint ez az incidens egy éles váltás a kiberbiztonsági környezetben, amelyre minden európai, így magyar vállalatnak is reagálnia kell. A következmények túlmutatnak a technikai részleteken, és érintik a szabályozási megfelelést és az üzleti kockázatkezelést is.
OWASP LLM Top 10 és a gyakorlat
A leírt támadási módszerek tökéletesen illeszkednek az OWASP LLM Top 10 kockázati listájába. A hamis perszónákkal végrehajtott „jailbreak” egyértelműen az LLM01: Prompt Injection kategóriába tartozik. Az AI modellek használata sebezhetőségek felkutatására pedig rávilágít az LLM06: Sensitive Information Disclosure kockázatára, különösen, ha a modelleket véletlenül érzékeny, belső kódrészleteken tanítják be. A támadók által felfedezett „logikai hibák”, amelyeket a hagyományos szkennerek nem vesznek észre, az LLM09: Overreliance (Túlzott bizalom) veszélyét hangsúlyozzák: nem bízhatunk vakon a régi eszközökben az AI-korszakban.
EU AI Act és GDPR megfelelőség
Vállalati kontextusban ez azt jelenti, hogy a kockázatok exponenciálisan nőttek. Egy AI által felfedezett, 2FA-t megkerülő hiba katasztrofális adatvédelmi incidenst okozhat, ami a GDPR értelmében súlyos bírságokkal és reputációs kárral jár. Az incidens bejelentési kötelezettség és az érintettek tájékoztatása mellett a hatósági vizsgálatok is garantáltak.
Az EU AI Act szempontjából a helyzet még összetettebb. Bár a támadók által használt AI modellek nyilvánvalóan nem lesznek „megfelelőek”, a védekező oldalon használt AI-alapú biztonsági rendszerek (pl. anomália-detektálás, kód-elemzés) valószínűleg a magas kockázatú kategóriába eshetnek. A vállalatoknak tehát nemcsak a támadások ellen kell védekezniük, hanem igazolniuk kell, hogy a saját védelmi AI-rendszereik megfelelnek a szigorú átláthatósági, adatkezelési és kockázatértékelési követelményeknek. Az AI-biztonsági audit és a megfelelőségi tanácsadás ezért válik megkerülhetetlenné.
A védekezés is AI-alapú: Egy új fegyverkezési verseny
A kép azonban nem teljesen sötét. Ahogy a támadók, úgy a védők is egyre hatékonyabban használják a mesterséges intelligenciát. A Google jelentése megemlíti, hogy a cég saját „Big Sleep” nevű AI-ügynöke már 2025 vége óta aktívan keres és talál zero-day sebezhetőségeket a védők számára. Hasonlóképpen, a Mozilla áprilisban arról számolt be, hogy a saját védekező AI-eszközeik egyetlen futtatás alatt elképesztő mennyiségű hibát képesek felszínre hozni.
Ez egyértelműen egy fegyverkezési verseny. Azok a szervezetek, amelyek nem invesztálnak AI-alapú védelmi technológiákba és proaktív biztonsági auditokba – beleértve az LLM red teaminget is –, menthetetlenül lemaradnak. Ahogy John Hultquist fogalmazott:
„Végre bizonyítékot találtunk arra, hogy ez megtörténik. Ez valószínűleg csak a jéghegy csúcsa, és biztosan nem ez lesz az utolsó.”
Az AIQ álláspontja szerint a kérdés már nem az, hogy a támadók használnak-e AI-t, hanem az, hogy a mi védelmünk felkészült-e erre.