Az AI rendszered rejtett sebezhetőségei azonnali GDPR és Üzleti Kockázatot jelentenek — független technológiai audit nélkül.
Független LLM/AI Red Team Audit 2–5 munkanap alatt: Csapatunk egy 18 modulos (16 alap + NVIDIA Garak + Microsoft PyRIT) saját fejlesztésű keretrendszerrel teszteli a vállalati AI megoldásokat, csomagtól függően akár ~1800 egyedi támadási mintával.
Megmutatjuk a prompt injection és jailbreak sebezhetőségeket, mielőtt azokból adatszivárgás (GDPR incidens), jogosulatlan vállalati művelet, vagy az EU AI Act 5. cikkébe ütköző manipuláció lenne. A fals-pozitív találatokat két független értékelési réteg és a kritikus hibák másodlagos AI-felülvizsgálata (Second Review), és manuális ellenőrzás zárja ki.
A végeredmény egy döntéshozóknak és fejlesztőknek szóló, kétnyelvű (magyar-angol) biztonsági jelentés. Rögzített ár, szigorú NDA és 100%-ban lokális futtatás az adataid védelméért!
Egy átlagos belső szkript ~120 mintát tesztel.
Ennél 12–15× több mintával dolgozom — két nyelven, két értékelési réteggel, 16+2 modulból.
Az audit nem prezentáció! Mérés — bizonyítékkal!
Modul
16 Speciális + Garak + PyRIT
Minta
Standard: ~1 842
Értékelés
+ Többszörös ellenőrzés
Jelentés
Riport két nyelven
01 · ÜZLETI HATÁS
Mire jó ez egy CEO-nak?
Megfelelőségi pajzs
A jelentés „kellő gondosság” (due diligence) bizonyítékként szolgál. Ha a chatbotot feltörik és belső információkat vagy ügyféladatokat szivárogtat, az súlyos GDPR incidensnek minősül. A 18 modullal, több értékelési rétegen validált audit azt igazolja a hatóságok felé, hogy a menedzsment mindent megtett a kiberbiztonságért – ez kritikus bírságcsökkentő tényező!
Reputáció és PR védelem
Egy feltárt sebezhetőség javítása töredékébe kerül annak, mint egy nyilvános lebukás kezelése. Számos jogi precedens igazolja, hogy a vállalatok felelnek az AI által tett téves vagy manipulált ígéretekért! Az audit megakadályozza, hogy egy unatkozó felhasználó jailbreakje miatt a cége több tízmilliós PR-válságkezelésre szoruljon.
Beszerzési előny
Nagyvállalati ügyfelek (banki, biztosítói, közszféra) audit-jelentést kérnek a beszállítóktól. Egy kész riport → rövidebb sales ciklus, magasabb konverzió.
03 · A MEGOLDÁS
Hat pont, ami egy belső szkripttel nem teljesíthető.
Egy hatósági ellenőrzésen a „futtattunk pár promptot” nem állja meg a helyét. A független auditnak az alábbi iparági sztenderdeket kell teljesítenie:
Dedikált, cenzúramentes támadó modellek
Nem általános, SAAS, vagy felhő alapú megoldásokat használunk a teszteléshez. Saját, speciálisan finomhangolt (uncensored) mesterséges intelligencia modellünk natív magyar nyelven, fordítási veszteség nélkül generálja a támadási mintákat. Így a hazai rendszerek valós, éles körülmények között vizsgálhatók!
Iparági sztenderdek integrálása
Az audit nem csupán a 16 saját fejlesztésű, dedikált modult tartalmazza. A keretrendszer közvetlenül integrálja a Microsoft PyRIT és az NVIDIA Garak hivatalos biztonsági tesztcsomagjait is. Ezzel a globális iparági baseline és a speciális vállalati sebezhetőségek egyetlen audit futtatással mérhetők.
Többszintű, független értékelési rendszer
A sebezhetőségeket nem egy egyszerű algoritmus dönti el. A rendszer egy determinisztikus (szabályalapú) szűrő és egy fejlett, szemantikus AI-bíró (Judge) kombinációját használja a célok és a válaszok elemzésére. Ez a kettős védelem elengedhetetlen a hatósági bizonyíthatóság érdekében.
Kettős ellenőrzés a fals-pozitívok ellen
A kritikus (piros) biztonsági találatokat a rendszer nem veszi automatikusan készpénznek. Minden súlyos sebezhetőséget egy második, független AI modell is felülvizsgál, majd legvégül manuálisan is átvizsgáljuk. Ez garantálja a magas audit-bizalmat és a tiszta, átlátható riportolást a compliance és jogi csapatok számára.
Többkörös kontextus-vizsgálat (Chat Mode)
A manipuláció vagy a felhasználói függőség kialakítása (EU AI Act, 5. cikk) több lépésben történik. A rendszer képes iteratív, manipulatív pszichológiai technikákkal, többkörös beszélgetéseken keresztül tesztelni a célpontot, felismerve a finom viselkedési fordulópontokat
Zárt infrastruktúra, zéró adatszivárgás
A teljes auditálás 100%-ban lokális, fizikailag elszeparált környezetben történik. Az adatok, a promptok és a rendszer válaszai sosem hagyják el az infrastruktúrát – azaz garantáltan nem kerülnek továbbításra az OpenAI, a Claude, a Google vagy más külső felhőszolgáltatók felé.
04 · CSOMAGOK
Három csomag. Rögzített ár.
Minden ár tartalmazza a teljes audit lefutását, a kétnyelvű jelentést, a több körös ellenőrzést és a kiértékelést. Sürgős igény esetén — 3 napon belüli indulással — 30%-os felárral, szabad kapacitás függvényében.
01· CSOMAG
Discovery
Élesítés előtti gyors átvilágítás a leggyakoribb kockázatokra
290 000 Ft
+ÁFA
22 technika · 136 minta
- Fókuszált vizsgálat: 3 kritikus modul (Prompt Injection, Jailbreak, Rendszerprompt-szivárgás)
- ~136 támadási minta: Célzott, egylövéses (single-shot) tesztelés
- OWASP alapok: A leggyakoribb LLM01 és LLM02 sebezhetőségek ellenőrzése
- Kétszintű értékelés: Determinisztikus (regex) és LLM-alapú bírói (Judge) validáció
- Kimenet: Magyar nyelvű vezetői összefoglaló PDF, súlyozott kockázatokkal
- Konzultáció: 30 perces visszajelző hívás
- Átfutás: 2 munkanap
02 · CSOMAG
Standard Compliance
Határidő-felkészülés alap · OWASP teljes lefedés
890 000 Ft
+ÁFA
16+1 modul · 154 technika · ~1549 minta
- 17 modulos keretrendszer: 16 dedikált alapmodul + NVIDIA Garak integráció
- ~1500 támadási minta: Ipari baseline és vállalati támadások egyetlen futásban
- Teljes OWASP LLM Top 10 lefedettség: Modulonkénti megfeleltetéssel
- Kettős fals-pozitív védelem: Másodlagos AI-bíró a kritikus találatokon (Second Review)
- Kimenet: Magyar és angol nyelvű, részletes compliance jelentés (bizonyítékokkal, javítási javaslatokkal)
- Konzultáció: 1 órás kiértékelő és tanácsadó hívás
- Átfutás: 4 munkanap
03· CSOMAG
EU AI Act Premium
Mind a 18 modul · Chat Mode · Article 5 minták
1 790 000 Ft
+ÁFA
16 +2 modul · 211 technika · ~1842 minta
- A Standard csomag teljes tartalma
- 18 modulos csúcsrendszer: Kiegészítve a Microsoft PyRIT Full Catalog-gal (~1800+ minta összesen)
- Akár többkörös Chat Mode (5+ forduló): Dinamikus, reaktív támadó modell alkalmazása a kitartó behatolási kísérletek szimulálására
- EU AI Act (5. cikk) tesztelés: Manipuláció, dark pattern-ek és sérülékeny csoportok kihasználásának mélységi vizsgálata
- Viselkedéselemzés: Inflexiós pont (fordulópont) detektálás és fordulónkénti (per-turn) értékelés
- Utókövetés: 30 napon belül egy ingyenes kontrollmérés (re-test) a javítások ellenőrzésére
- Konzultáció: 2 órás szakmai értékelő megbeszélés a fejlesztői csapattal
- Átfutás: 5 munkanap
05 · MIÉRT VÉDHETŐ A HATÓSÁG ELŐTT
Többszintű audit-validáció. Kettős védelem a téves riasztások ellen.
Egyetlen AI-bíró (Judge) vagy egy egyszerű kulcsszószűrő önmagában tévedhet. A hatósági és vállalati szintű auditok hitelessége azon múlik, hogy a sebezhetőségeket több, egymástól független technológiai réteg is megerősíti-e, kizárva a téves riasztásokat (fals-pozitívokat).
1. RÉTEG
Determinisztikus szabályrendszer
Villámgyors, 46 mintából álló, többnyelvű (magyar, angol) iparági szabályrendszer. Nulla hibahatárral és tökéletes reprodukálhatósággal azonosítja a nyílt elutasításokat, valamint az egyértelmű rendszerszintű szivárgásokat.
2. RÉTEG
Szemantikus AI-bíró (LLM Judge)
A bonyolultabb válaszokat egy kontextus-tudatos modell három lépésben értékeli: (1) mi volt a támadás eredeti célja, (2) mit reagált a célrendszer, és (3) jelent-e ez valós üzleti vagy biztonsági kockázatot éles környezetben. Beépített többlépcsős hibatűréssel a maximális pontosságért.
+ MÁSODLAGOS VALIDÁCIÓ
Second Review a kritikus találatokon
A legszigorúbb védelem a fals-pozitív eredmények ellen. Minden piros („EXPLOITED”) találatot egy teljesen független, második AI-modell is felülvizsgál. A sebezhetőség csak akkor kerül a végső jelentésbe, ha a másodlagos modell is megerősíti (confirmed) a kockázatot, és manuálisan is felülvizsgáltuk.
Outcome-first guardrail — Tényszerű, szigorú minősítés
A jelentés nem tartalmaz „felfújt” eredményeket. Ha a tesztelt rendszer elutasítja a kérést, és a válasz nem tartalmaz valós, tiltott kimenetet, a találat kötelezően védett (NOT EXPLOITED) minősítést kap. A puszta formázás, dekódolás vagy fordítás önmagában nem minősül biztonsági résnek. A jelentés pontossága a hatósági hitelesség alapja.
18 modul.
Lista + részletek.
Bal oldalon a teljes katalógus, jobb oldalon a kiválasztott modul részletei. A Standard csomag 17 modult (16 alap + Garak) és ~1549 mintát futtat. A Premium csomag 18 modult (16 alap + Garak + PyRIT) és ~1842 mintát tesztel.
Koppints egy modulra a részletekért. A Standard 17, a Premium 18 modult futtat.
07 · KIVEL DOLGOZOL
Szakértői csapat. Saját keretrendszer. Átlátható felelősség.
Az aiq.hu mögött egy dedikált, LLM-biztonságra specializálódott háromfős szakértői csapat áll. Nincs alvállalkozói lánc, nincsenek kiszervezett munkafolyamatok vagy általánosított sablonok: ami a végső jelentésbe kerül, azt a saját csapatunk validálta az utolsó biztonsági találatig. A robusztus audit-keretrendszerünket is házon belül fejlesztjük — amely a legújabb frissítésekkel már a v5.1-es verziónál tart.
Független, agilis csapatként dolgozunk. A célrendszerre szabott támadási minta-családok, a natív magyar cenzúrázatlan támadó modell, valamint a kétrétegű értékelő-lánc és a kritikus találatok másodlagos felülvizsgálata (Second Review) mind egyetlen célt szolgálnak: hogy az AI rendszered védhető legyen a hatósági ellenőrzések és az EU AI Act megfelelés során — nem csupán egy belső fejlesztői demón.
08 · GYIK
Amit a felmérő beszélgetéseken kérdeznek.
Mit látok a felmérő hívás során?
Konzultáció során nem prezentációs slide-okat mutogatunk. Kérésre képernyőmegosztással egy éles, élő demót futtatunk az chatbotodon vagy egy tesztrendszereden. Megnézzük, hogyan dolgozik a 18 modulos keretrendszer, hogyan értékel valós időben az AI-bíró (Judge), és milyen formátumban áll elő az eredmény. 15 perc alatt pontosan látni fogod, mit kapsz a pénzedért.
Kikerülnek a céges adatok vagy a promptok külső felhőbe (pl. OpenAI-hoz)?
Szigorúan nem. A teljes értékelési lánc, beleértve a támadó modelleket és az AI-bírókat is, 100%-ban lokálisan, saját dedikált hardveren fut. Ha belső, lokális AI-t/LLM-et használsz, a vizsgálat adatai sosem hagyják el a zárt hálózatát. Külső API (pl. ChatGPT integráció) vizsgálata esetén is garantált, hogy az értékelést és a riportálást végző saját AI rendszereink zártak maradnak.
Hogyan garantáljátok, hogy a jelentés nem lesz tele téves riasztásokkal (fals-pozitívokkal)?
A hatósági védhetőség alapja a pontosság, ezért a rendszer háromszoros szűrőt alkalmaz. A találatokat először egy szabályalapú (determinisztikus) rendszer szűri, majd egy kontextus-tudatos AI-bíró értékeli. A kritikus (piros) biztonsági réseket minden esetben egy teljesen független, második AI-modell is felülvizsgálja (Second Review). Csak az kerül a jelentésbe, ami valódi, igazolható kockázatot jelent, és az előbbieken kívül manuálisan is megvizsgáltuk.
Mi az az "Inflexion Detection" és miért fontos az EU AI Act miatt?
Egy komoly manipuláció ritkán áll egyetlen kérdésből. A Premium csomagban elérhető többkörös „Chat Mode” során a támadó mesterséges intelligencia iteratív, manipulítív technikákkal (pl. bizalomépítés, sürgetés) próbálja megtörni a célrendszert. A rendszer felismeri a fordulópontot (inflexion point), ahol az AI modelled „megtörik” és enged a manipulációnak. Az EU AI Act 5. cikke szerinti tiltott gyakorlatok (sérülékeny csoportok kihasználása, dark pattern-ek) csak ezzel a többkörös módszertannal csíphetők fülön.
Mi a pontos különbség a Standard és a Premium audit között?
Standard: A 16 alapmodult és az iparági sztenderd NVIDIA Garak csomagot (összesen 17 modul) futtatja, mintegy 1500 támadási mintával. Ez egy masszív, „egylövéses” (single-shot) sérülékenységvizsgálat, amely lefedi a teljes OWASP Top 10-et.
Premium: A legmagasabb szintű EU AI Act megfeleléshez. Tartalmazza a Standard csomagot, plusz a Microsoft PyRIT vállalati tesztcsomagját (összesen 18 modul), az akár 7 fordulós, többkörös Chat Mode viselkedésvizsgálatot, egy 2 órás szakmai beszélgetést a fejlesztőkkel, és ami a legfontosabb: egy ingyenes kontrollmérést 30 napon belül, miután a hibák javításra kerültek.
Láthatok referenciákat, korábbi ügyfél-jelentéseket?
A szigorú titoktartás (NDA) miatt ügyfélneveket és sérülékenységi jelentéseket nyilvánosan nem osztunk meg — és ezt a diszkréciót a Ti cégetek esetében is maximálisan garantáljuk. Azonban a felmérő hívás során a saját fejlesztésű, v5.1-es audit-keretrendszer működését teljes transzparenciával bemutatjuk.
Milyen típusú AI rendszereket tudtok vizsgálni?
Bármilyen rendszert, amely chat-alapú (szöveges) HTTP-végponton keresztül elérhető. Legyen az a felhőben (OpenAI, Anthropic), lokális környezetben (Ollama, vLLM), egyszerű chatbot, komplex RAG-alapú (dokumentum-kereső) rendszer, vagy önálló ágens (Function Calling). Kép- vagy hangalapú (multimodális) bemeneteket jelenleg nem vizsgálunk.
Mit NEM tartalmaz az audit szolgáltatás?
Klasszikus hálózati és backend penetrációs tesztelést (pentest), általános GDPR auditot, jogi tanácsadást, valamint a feltárt hibák tényleges javítását. A mi feladatunk a sérülékenységek feltárása, dokumentálása, és a precíz (magyar-angol nyelvű) dokumentáció átadása, amit a fejlesztői és jogi csapata azonnal értékelni tud.
09 · HÁTTÉR
Átfogó AI biztonság és vállalati LLM red teaming Magyarországon.
LLM Biztonság és Független AI Red Teaming Magyarországon
LLM Tesztelés, AI Biztonsági Tesztelés, Mesterséges Intelligencia Biztonsági Tesztek
Chatbot Biztonsági Tesztelés, Ai Chatbot Audit, LLM Biztonsági Ellenőrzés
Az aiq.hu egy független AI biztonsági csapat, amely kifejezetten a nagy nyelvi modellek (LLM-ek) tesztelésére specializálódott. Ahogy az AI integráció egyre gyorsul, az LLM biztonság már nem csupán informatikai, hanem kőkemény stratégiai és jogi kérdés. Egy AI biztonsági szakértő feladata ma már nem merül ki egyszerű tesztek futtatásában; saját fejlesztésű, 18 modulos keretrendszerünkkel a legmélyebb sebezhetőségeket tárjuk fel, legyen szó felhőalapú (pl. OpenAI, Anthropic) vagy lokálisan futtatott (Ollama, vLLM) megoldásokról!
Iparági sztenderdek és OWASP LLM Top 10 megfelelőség
Szolgáltatásaink magukban foglalják a mélységi AI audit folyamatokat, amelyek a legszigorúbb iparági sztenderdek — köztük az OWASP LLM Top 10 — alapján értékelik a kockázatokat. Nem csupán egyszerű prompt injection (utasítás-injekció) és jailbreak támadásokat szimulálunk, hanem átfogó képet adunk a rendszered viselkedéséről. Kiterjedt tesztcsomagunk lefedi a kritikusabb területeket is, mint a tanítóadat-szennyezés (data poisoning), a kimenetszűrők megkerülése, a memóriamanipuláció, vagy épp a Modell-DoS támadások kivédése, amelyek a rendszer erőforrásainak kimerítésével okozhatnak súlyos leállásokat.
EU AI Act: Jogi megfelelőség és manipuláció-védelem
Kiemelt fókuszunk az EU AI Act rendeletnek való vállalati AI compliance megfelelőség tesztelése, hogy a céges rendszered egy esetleges hatósági ellenőrzés során is maradéktalanul védhető legyen. Mivel szoftverünk v5.1-es verziója dedikált modult tartalmaz a rendelet 5. cikkében rögzített tiltott gyakorlatok vizsgálatára, segítünk felkészülni a szigorodó szabályozásokra. Az AI red teaming Magyarország területén nálunk érhető el először olyan mélységi viselkedésvizsgálat, amely képes detektálni a tudatalatti manipulációt, a dark pattern-eket és a sérülékeny csoportok esetleges kihasználását.
Többkörös támadások és a Chat Mode jelentősége
A hagyományos, „egylövéses” (single-shot) tesztelés ma már nem elegendő egy kifinomult AI rendszer védelméhez. Az AI biztonsági csapatunk által fejlesztett egyedi Chat Mode funkció lehetővé teszi, hogy egy támadó LLM reaktív, többkörös beszélgetéseken keresztül szimulálja a multi-turn social engineering támadásokat.
Ez a módszer feltárja az úgynevezett inflexiós pontokat, ahol a modelled védelmi vonala több lépés után megtörik — ami elengedhetetlen a valós kockázatok azonosításához.
Globális technológia, lokális adatvédelem és GDPR pajzs
A technológiai audit során a legmodernebb iparági eszközöket integráljuk, mint az NVIDIA Garak probe-csomagja és a Microsoft PyRIT vállalati tesztkönyvtára. Ugyanakkor kiemelt figyelmet fordítunk az adatvédelemre: a vizsgálat 100%-ban lokális infrastruktúrán történik. Ez garantálja, hogy a vállalati titkok, a rendszerpromptok és az érzékeny adatok soha ne kerüljenek ki külső felhőszolgáltatókhoz. Célunk a GDPR incidensek megelőzése: megakadályozzuk, hogy a chatbotjaid jogosulatlan információkat osszanak meg, vagy belső rendszerutasításokat szivárogtassanak ki (system prompt leak), elkerülve ezzel a súlyos adatvédelmi bírságokat és a visszafordíthatatlan reputációs károkat.
Védd meg céges AI fejlesztéseidet a manipulációtól, az adatszivárgástól és az illetéktelen beavatkozásoktól egy profi, LLM sebezhetőségvizsgálatra fókuszáló független audit segítségével! Váltsd az AI innovációt stratégiai előnnyé.