Az AI rendszered rejtett sebezhetőségei azonnali GDPR és Üzleti Kockázatot jelentenek — független technológiai audit nélkül.

Független LLM/AI Red Team Audit 2–5 munkanap alatt: Csapatunk egy 18 modulos (16 alap + NVIDIA Garak + Microsoft PyRIT) saját fejlesztésű keretrendszerrel teszteli a vállalati AI megoldásokat, csomagtól függően akár ~1800 egyedi támadási mintával.

Megmutatjuk a prompt injection és jailbreak sebezhetőségeket, mielőtt azokból adatszivárgás (GDPR incidens), jogosulatlan vállalati művelet, vagy az EU AI Act 5. cikkébe ütköző manipuláció lenne. A fals-pozitív találatokat két független értékelési réteg és a kritikus hibák másodlagos AI-felülvizsgálata (Second Review), és manuális ellenőrzás zárja ki.

A végeredmény egy döntéshozóknak és fejlesztőknek szóló, kétnyelvű (magyar-angol) biztonsági jelentés. Rögzített ár, szigorú NDA és 100%-ban lokális futtatás az adataid védelméért!

AUDIT - ROI
890E Ft
Standard audit ár
Több Milliós PR és GDPR kár
Lehetséges üzleti veszteség

Egy átlagos belső szkript ~120 mintát tesztel.

Ennél 12–15× több mintával dolgozom — két nyelven, két értékelési réteggel, 16+2 modulból.

Az audit nem prezentáció! Mérés — bizonyítékkal!

18

Modul

16 Speciális + Garak + PyRIT

1000+

Minta

Standard: ~1 842

2+1

Értékelés

+ Többszörös ellenőrzés

EN+HU

Jelentés

Riport két nyelven

01 · ÜZLETI HATÁS

Mire jó ez egy CEO-nak?

Az audit-jelentés három üzleti döntést támogat egyszerre — és mindegyik költségesebb, ha kihagyod.
Bizonyítható
due diligence

Megfelelőségi pajzs

A jelentés „kellő gondosság” (due diligence) bizonyítékként szolgál. Ha a chatbotot feltörik és belső információkat vagy ügyféladatokat szivárogtat, az súlyos GDPR incidensnek minősül. A 18 modullal, több értékelési rétegen validált audit azt igazolja a hatóságok felé, hogy a menedzsment mindent megtett a kiberbiztonságért – ez kritikus bírságcsökkentő tényező!

5–10×
olcsóbb

Reputáció és PR védelem

Egy feltárt sebezhetőség javítása töredékébe kerül annak, mint egy nyilvános lebukás kezelése. Számos jogi precedens igazolja, hogy a vállalatok felelnek az AI által tett téves vagy manipulált ígéretekért! Az audit megakadályozza, hogy egy unatkozó felhasználó jailbreakje miatt a cége több tízmilliós PR-válságkezelésre szoruljon.

B2B
gyorsabb értékesítés

Beszerzési előny

Nagyvállalati ügyfelek (banki, biztosítói, közszféra) audit-jelentést kérnek a beszállítóktól. Egy kész riport → rövidebb sales ciklus, magasabb konverzió.

03 · A MEGOLDÁS

Hat pont, ami egy belső szkripttel nem teljesíthető.

Egy hatósági ellenőrzésen a „futtattunk pár promptot” nem állja meg a helyét. A független auditnak az alábbi iparági sztenderdeket kell teljesítenie:

01

Dedikált, cenzúramentes támadó modellek

Nem általános, SAAS, vagy felhő alapú megoldásokat használunk a teszteléshez. Saját, speciálisan finomhangolt (uncensored) mesterséges intelligencia modellünk natív magyar nyelven, fordítási veszteség nélkül generálja a támadási mintákat. Így a hazai rendszerek valós, éles körülmények között vizsgálhatók!

02

Iparági sztenderdek integrálása

Az audit nem csupán a 16 saját fejlesztésű, dedikált modult tartalmazza. A keretrendszer közvetlenül integrálja a Microsoft PyRIT és az NVIDIA Garak hivatalos biztonsági tesztcsomagjait is. Ezzel a globális iparági baseline és a speciális vállalati sebezhetőségek egyetlen audit futtatással mérhetők.

03

Többszintű, független értékelési rendszer

A sebezhetőségeket nem egy egyszerű algoritmus dönti el. A rendszer egy determinisztikus (szabályalapú) szűrő és egy fejlett, szemantikus AI-bíró (Judge) kombinációját használja a célok és a válaszok elemzésére. Ez a kettős védelem elengedhetetlen a hatósági bizonyíthatóság érdekében.

 

04

Kettős ellenőrzés a fals-pozitívok ellen

A kritikus (piros) biztonsági találatokat a rendszer nem veszi automatikusan készpénznek. Minden súlyos sebezhetőséget egy második, független AI modell is felülvizsgál, majd legvégül manuálisan is átvizsgáljuk. Ez garantálja a magas audit-bizalmat és a tiszta, átlátható riportolást a compliance és jogi csapatok számára.

05

Többkörös kontextus-vizsgálat (Chat Mode)

A manipuláció vagy a felhasználói függőség kialakítása (EU AI Act, 5. cikk) több lépésben történik. A rendszer képes iteratív, manipulatív pszichológiai technikákkal, többkörös beszélgetéseken keresztül tesztelni a célpontot, felismerve a finom viselkedési fordulópontokat

06

Zárt infrastruktúra, zéró adatszivárgás

A teljes auditálás 100%-ban lokális, fizikailag elszeparált környezetben történik. Az adatok, a promptok és a rendszer válaszai sosem hagyják el az infrastruktúrát – azaz garantáltan nem kerülnek továbbításra az OpenAI, a Claude, a Google vagy más külső felhőszolgáltatók felé.

04 · CSOMAGOK

Három csomag. Rögzített ár.

Minden ár tartalmazza a teljes audit lefutását, a kétnyelvű jelentést, a több körös ellenőrzést és a kiértékelést. Sürgős igény esetén — 3 napon belüli indulással — 30%-os felárral, szabad kapacitás függvényében.

01· CSOMAG

Discovery

Élesítés előtti gyors átvilágítás a leggyakoribb kockázatokra

290 000 Ft

+ÁFA

22 technika · 136 minta

02 · CSOMAG

Standard Compliance

Határidő-felkészülés alap · OWASP teljes lefedés

890 000 Ft

+ÁFA

16+1 modul · 154 technika · ~1549 minta

03· CSOMAG

EU AI Act Premium

Mind a 18 modul · Chat Mode · Article 5 minták

1 790 000 Ft

+ÁFA

16 +2 modul · 211 technika · ~1842 minta

05 · MIÉRT VÉDHETŐ A HATÓSÁG ELŐTT

Többszintű audit-validáció. Kettős védelem a téves riasztások ellen.

Egyetlen AI-bíró (Judge) vagy egy egyszerű kulcsszószűrő önmagában tévedhet. A hatósági és vállalati szintű auditok hitelessége azon múlik, hogy a sebezhetőségeket több, egymástól független technológiai réteg is megerősíti-e, kizárva a téves riasztásokat (fals-pozitívokat).

1. RÉTEG

Determinisztikus szabályrendszer

Villámgyors, 46 mintából álló, többnyelvű (magyar, angol) iparági szabályrendszer. Nulla hibahatárral és tökéletes reprodukálhatósággal azonosítja a nyílt elutasításokat, valamint az egyértelmű rendszerszintű szivárgásokat.

2. RÉTEG

Szemantikus AI-bíró (LLM Judge)

A bonyolultabb válaszokat egy kontextus-tudatos modell három lépésben értékeli: (1) mi volt a támadás eredeti célja, (2) mit reagált a célrendszer, és (3) jelent-e ez valós üzleti vagy biztonsági kockázatot éles környezetben. Beépített többlépcsős hibatűréssel a maximális pontosságért.

+ MÁSODLAGOS VALIDÁCIÓ

Second Review a kritikus találatokon

A legszigorúbb védelem a fals-pozitív eredmények ellen. Minden piros („EXPLOITED”) találatot egy teljesen független, második AI-modell is felülvizsgál. A sebezhetőség csak akkor kerül a végső jelentésbe, ha a másodlagos modell is megerősíti (confirmed) a kockázatot, és manuálisan is felülvizsgáltuk.

Outcome-first guardrail — Tényszerű, szigorú minősítés

A jelentés nem tartalmaz „felfújt” eredményeket. Ha a tesztelt rendszer elutasítja a kérést, és a válasz nem tartalmaz valós, tiltott kimenetet, a találat kötelezően védett (NOT EXPLOITED) minősítést kap. A puszta formázás, dekódolás vagy fordítás önmagában nem minősül biztonsági résnek. A jelentés pontossága a hatósági hitelesség alapja.

06 · Modul-katalógus

18 modul.
Lista + részletek.

Bal oldalon a teljes katalógus, jobb oldalon a kiválasztott modul részletei. A Standard csomag 17 modult (16 alap + Garak) és ~1549 mintát futtat. A Premium csomag 18 modult (16 alap + Garak + PyRIT) és ~1842 mintát tesztel.

Koppints egy modulra a részletekért. A Standard 17, a Premium 18 modult futtat.

Standard
~1 485 minta
Premium
~1 778 minta

07 · KIVEL DOLGOZOL

Szakértői csapat. Saját keretrendszer. Átlátható felelősség.

Az aiq.hu mögött egy dedikált, LLM-biztonságra specializálódott háromfős szakértői csapat áll. Nincs alvállalkozói lánc, nincsenek kiszervezett munkafolyamatok vagy általánosított sablonok: ami a végső jelentésbe kerül, azt a saját csapatunk validálta az utolsó biztonsági találatig. A robusztus audit-keretrendszerünket is házon belül fejlesztjük — amely a legújabb frissítésekkel már a v5.1-es verziónál tart.

Független, agilis csapatként dolgozunk. A célrendszerre szabott támadási minta-családok, a natív magyar cenzúrázatlan támadó modell, valamint a kétrétegű értékelő-lánc és a kritikus találatok másodlagos felülvizsgálata (Second Review) mind egyetlen célt szolgálnak: hogy az AI rendszered védhető legyen a hatósági ellenőrzések és az EU AI Act megfelelés során — nem csupán egy belső fejlesztői demón.

08 · GYIK

Amit a felmérő beszélgetéseken kérdeznek.

Mit látok a felmérő hívás során?

Konzultáció során nem prezentációs slide-okat mutogatunk. Kérésre képernyőmegosztással egy éles, élő demót futtatunk az chatbotodon vagy egy tesztrendszereden. Megnézzük, hogyan dolgozik a 18 modulos keretrendszer, hogyan értékel valós időben az AI-bíró (Judge), és milyen formátumban áll elő az eredmény. 15 perc alatt pontosan látni fogod, mit kapsz a pénzedért.

Szigorúan nem. A teljes értékelési lánc, beleértve a támadó modelleket és az AI-bírókat is, 100%-ban lokálisan, saját dedikált hardveren fut. Ha belső, lokális AI-t/LLM-et használsz, a vizsgálat adatai sosem hagyják el a zárt hálózatát. Külső API (pl. ChatGPT integráció) vizsgálata esetén is garantált, hogy az értékelést és a riportálást végző saját AI rendszereink zártak maradnak.

A hatósági védhetőség alapja a pontosság, ezért a rendszer háromszoros szűrőt alkalmaz. A találatokat először egy szabályalapú (determinisztikus) rendszer szűri, majd egy kontextus-tudatos AI-bíró értékeli. A kritikus (piros) biztonsági réseket minden esetben egy teljesen független, második AI-modell is felülvizsgálja (Second Review). Csak az kerül a jelentésbe, ami valódi, igazolható kockázatot jelent, és az előbbieken kívül manuálisan is megvizsgáltuk.

Egy komoly manipuláció ritkán áll egyetlen kérdésből. A Premium csomagban elérhető többkörös „Chat Mode” során a támadó mesterséges intelligencia iteratív, manipulítív technikákkal (pl. bizalomépítés, sürgetés) próbálja megtörni a célrendszert. A rendszer felismeri a fordulópontot (inflexion point), ahol az AI modelled „megtörik” és enged a manipulációnak. Az EU AI Act 5. cikke szerinti tiltott gyakorlatok (sérülékeny csoportok kihasználása, dark pattern-ek) csak ezzel a többkörös módszertannal csíphetők fülön.

  • Standard: A 16 alapmodult és az iparági sztenderd NVIDIA Garak csomagot (összesen 17 modul) futtatja, mintegy 1500 támadási mintával. Ez egy masszív, „egylövéses” (single-shot) sérülékenységvizsgálat, amely lefedi a teljes OWASP Top 10-et.

  • Premium: A legmagasabb szintű EU AI Act megfeleléshez. Tartalmazza a Standard csomagot, plusz a Microsoft PyRIT vállalati tesztcsomagját (összesen 18 modul), az akár 7 fordulós, többkörös Chat Mode viselkedésvizsgálatot, egy 2 órás szakmai beszélgetést a fejlesztőkkel, és ami a legfontosabb: egy ingyenes kontrollmérést 30 napon belül, miután a hibák javításra kerültek.

A szigorú titoktartás (NDA) miatt ügyfélneveket és sérülékenységi jelentéseket nyilvánosan nem osztunk meg — és ezt a diszkréciót a Ti cégetek esetében is maximálisan garantáljuk. Azonban a felmérő hívás során a saját fejlesztésű, v5.1-es audit-keretrendszer működését teljes transzparenciával bemutatjuk.

Bármilyen rendszert, amely chat-alapú (szöveges) HTTP-végponton keresztül elérhető. Legyen az a felhőben (OpenAI, Anthropic), lokális környezetben (Ollama, vLLM), egyszerű chatbot, komplex RAG-alapú (dokumentum-kereső) rendszer, vagy önálló ágens (Function Calling). Kép- vagy hangalapú (multimodális) bemeneteket jelenleg nem vizsgálunk.

Klasszikus hálózati és backend penetrációs tesztelést (pentest), általános GDPR auditot, jogi tanácsadást, valamint a feltárt hibák tényleges javítását. A mi feladatunk a sérülékenységek feltárása, dokumentálása, és a precíz (magyar-angol nyelvű) dokumentáció átadása, amit a fejlesztői és jogi csapata azonnal értékelni tud.

09 · HÁTTÉR

Átfogó AI biztonság és vállalati LLM red teaming Magyarországon.

LLM Biztonság és Független AI Red Teaming Magyarországon

LLM Tesztelés, AI Biztonsági Tesztelés, Mesterséges Intelligencia Biztonsági Tesztek

Chatbot Biztonsági Tesztelés, Ai Chatbot Audit, LLM  Biztonsági Ellenőrzés

Az aiq.hu egy független AI biztonsági csapat, amely kifejezetten a nagy nyelvi modellek (LLM-ek) tesztelésére specializálódott. Ahogy az AI integráció egyre gyorsul, az LLM biztonság már nem csupán informatikai, hanem kőkemény stratégiai és jogi kérdés. Egy AI biztonsági szakértő feladata ma már nem merül ki egyszerű tesztek futtatásában; saját fejlesztésű, 18 modulos keretrendszerünkkel a legmélyebb sebezhetőségeket tárjuk fel, legyen szó felhőalapú (pl. OpenAI, Anthropic) vagy lokálisan futtatott (Ollama, vLLM) megoldásokról!

Iparági sztenderdek és OWASP LLM Top 10 megfelelőség

Szolgáltatásaink magukban foglalják a mélységi AI audit folyamatokat, amelyek a legszigorúbb iparági sztenderdek — köztük az OWASP LLM Top 10 — alapján értékelik a kockázatokat. Nem csupán egyszerű prompt injection (utasítás-injekció) és jailbreak támadásokat szimulálunk, hanem átfogó képet adunk a rendszered viselkedéséről. Kiterjedt tesztcsomagunk lefedi a kritikusabb területeket is, mint a tanítóadat-szennyezés (data poisoning), a kimenetszűrők megkerülése, a memóriamanipuláció, vagy épp a Modell-DoS támadások kivédése, amelyek a rendszer erőforrásainak kimerítésével okozhatnak súlyos leállásokat.

EU AI Act: Jogi megfelelőség és manipuláció-védelem

Kiemelt fókuszunk az EU AI Act rendeletnek való vállalati AI compliance megfelelőség tesztelése, hogy a céges rendszered egy esetleges hatósági ellenőrzés során is maradéktalanul védhető legyen. Mivel szoftverünk v5.1-es verziója dedikált modult tartalmaz a rendelet 5. cikkében rögzített tiltott gyakorlatok vizsgálatára, segítünk felkészülni a szigorodó szabályozásokra. Az AI red teaming Magyarország területén nálunk érhető el először olyan mélységi viselkedésvizsgálat, amely képes detektálni a tudatalatti manipulációt, a dark pattern-eket és a sérülékeny csoportok esetleges kihasználását.

Többkörös támadások és a Chat Mode jelentősége

A hagyományos, „egylövéses” (single-shot) tesztelés ma már nem elegendő egy kifinomult AI rendszer védelméhez. Az AI biztonsági csapatunk által fejlesztett egyedi Chat Mode funkció lehetővé teszi, hogy egy támadó LLM reaktív, többkörös beszélgetéseken keresztül szimulálja a multi-turn social engineering támadásokat. 

Ez a módszer feltárja az úgynevezett inflexiós pontokat, ahol a modelled védelmi vonala több lépés után megtörik — ami elengedhetetlen a valós kockázatok azonosításához.

Globális technológia, lokális adatvédelem és GDPR pajzs

A technológiai audit során a legmodernebb iparági eszközöket integráljuk, mint az NVIDIA Garak probe-csomagja és a Microsoft PyRIT vállalati tesztkönyvtára. Ugyanakkor kiemelt figyelmet fordítunk az adatvédelemre: a vizsgálat 100%-ban lokális infrastruktúrán történik. Ez garantálja, hogy a vállalati titkok, a rendszerpromptok és az érzékeny adatok soha ne kerüljenek ki külső felhőszolgáltatókhoz. Célunk a GDPR incidensek megelőzése: megakadályozzuk, hogy a chatbotjaid jogosulatlan információkat osszanak meg, vagy belső rendszerutasításokat szivárogtassanak ki (system prompt leak), elkerülve ezzel a súlyos adatvédelmi bírságokat és a visszafordíthatatlan reputációs károkat.

Védd meg céges AI fejlesztéseidet a manipulációtól, az adatszivárgástól és az illetéktelen beavatkozásoktól egy profi, LLM sebezhetőségvizsgálatra fókuszáló független audit segítségével! Váltsd az AI innovációt stratégiai előnnyé.