18.2.1. Harmadik fél értékelések

2025.10.06.
AI Biztonság Blog

Amikor egy szervezet már hónapok, esetleg évek óta dolgozik egy AI rendszeren, elkerülhetetlenül kialakul egyfajta „üzemi vakság”. A csapat ismeri a rendszer minden csínját-bínját, a belső tesztek pedig az ismert gyengeségekre fókuszálnak. De mi történik, ha teljesen külső, elfogulatlan szemmel nézünk rá a rendszerre? 

Kapcsolati űrlap

AI Biztonság kérdésed van? Itt elérsz minket:

Itt lépnek képbe a harmadik fél által végzett értékelések, amelyek nem csupán egy pipa a megfelelőségi listán, hanem a robusztusság és a bizalom egyik legfontosabb tesztje.

A külső audit lényege, hogy egy független, specializált szervezet vizsgálja meg az AI rendszert, annak folyamatait és dokumentációját. Ez a függetlenség a legfőbb értéke: a külső értékelőnek nincsenek belső politikai vagy projekthez kötődő érdekei, így az eredmények objektívek és kíméletlenül őszinték lehetnek!

Miért van szükség külső szemre?

A belső red teaming és audit elengedhetetlen, de bizonyos célokat csak külső partner bevonásával lehet hatékonyan elérni. 

A legfőbb indokok a következők:

  • Objektivitás és függetlenség: A külső auditorok nincsenek kitéve a belső nyomásnak, nem részesei a vállalati kultúrának. Az őszinte, szűretlen visszajelzésük aranyat ér, még ha fájdalmas is néha.
  • Speciális szakértelem: Egy külső cég gyakran olyan mély, niche szaktudással rendelkezik (pl. specifikus adversarial ML támadások, AI etikai keretrendszerek auditálása), ami a belső csapatban esetleg nem áll rendelkezésre. A számos különböző iparági ügyfélnél szerzett tapasztalat aranyat ér! 
  • Hitelesség és bizalomépítés: Egy neves, független harmadik fél által kiállított pozitív értékelés vagy tanúsítvány jelentősen növeli a piac, az ügyfeleket, a befektetők és a szabályozó hatóságok bizalmát. Ez egy külső megerősítés arról, hogy a rendszer megfelel a legjobb gyakorlatoknak.
  • Szabályozói megfelelés: Ahogy az előző fejezetben láttuk, számos szabályozás (pl. az EU AI Act) előírhat vagy erősen javasolhat független, harmadik fél általi megfelelőségértékelést, különösen a magas kockázatú rendszerek esetében.

Az értékelők típusai: Ki kopogtat az ajtón?

Nem minden külső értékelő egyforma. A megfelelő partner kiválasztása attól függ, hogy mi az audit célja. A piac főbb szereplői a következők:

Értékelő típusa Elsődleges fókusz Tipikus eredmény
Nagy auditcégek (pl. Big Four) Folyamatok, irányítás, kockázatkezelés (GRC), standardoknak (pl. ISO, SOC 2) való megfelelés. Audit riport, tanúsítvány, menedzsment levél a kontrollhiányosságokról.
Boutique biztonsági cégek Mély technikai tesztelés, AI-specifikus penetrációs tesztelés, adversarial ML támadások, modell-lopás. Részletes technikai riport sebezhetőségekkel, PoC (Proof of Concept) kódokkal, javítási javaslatokkal.
AI etikai és megfelelőségi tanácsadók Etikai elvek (méltányosság, átláthatóság, elszámoltathatóság) vizsgálata, torzítás (bias) audit, hatásvizsgálatok. Etikai riport, torzítási elemzés, megfelelőségi mátrix, fejlesztési javaslatok.
Bug Bounty platformok Közösségi alapú (crowdsourced) sebezhetőség-keresés, folyamatos, ösztönző-alapú tesztelés. Folyamatos sebezhetőségi jelentések a kutatóktól, validált hibajegyek.

Az értékelési folyamat lépésről lépésre

Bár minden audit egyedi, a legtöbb harmadik fél általi értékelés egy jól bevált forgatókönyvet követ. Ez a strukturált megközelítés biztosítja, hogy minden releváns területet lefedjenek.

1. Scoping és Tervezés 2. Adatgyűjtés és Átvilágítás 3. Tesztelés és Elemzés 4. Jelentés és Utókövetés

1. Fázis: Hatókör meghatározása és tervezés (Scoping)

Ez a legkritikusabb fázis. Itt dől el, hogy pontosan mit, hogyan és miért fognak tesztelni. A közösen elfogadott „Rules of Engagement” (RoE) dokumentum tartalmazza a tesztelendő rendszerek listáját, az engedélyezett tesztelési módszereket, a kapcsolattartókat és a tesztelési időablakot. A rosszul definiált hatókör értelmetlen eredményekhez vezethet! 

2. Fázis: Adatgyűjtés és dokumentáció átvilágítása

Az auditorok nem vakon kezdenek tesztelni. Bekérik és alaposan áttanulmányozzák a releváns dokumentációt: architektúra diagramok, adatkezelési irányelvek, korábbi tesztek eredményei, kockázatelemzések, modellkártyák. Ez a fázis segít megérteni a rendszer működését és azonosítani a potenciálisan gyenge pontokat.

3. Fázis: Technikai és eljárásrendi tesztelés

Itt történik a „piszkos munka”. Az auditorok a scoping fázisban meghatározottak szerint kezdik el vizsgálni a rendszert. 

Ez magában foglalhatja:

  • Interjúkat a fejlesztőkkel, adatelemzőkkel és a termékmenedzserekkel.
  • Konfigurációk felülvizsgálatát a felhő környezetben vagy a CI/CD pipeline-ban.
  • Aktív tesztelést, például adversarial promptok küldését egy LLM-nek, vagy torzítás-ellenőrző scriptek futtatását a modell kimenetén.

Az egyszerűsített pszeudokód bemutathatja, hogyan néz ki egy automatizált tesztelési lépés, amely a modell válaszainak toxicitását vizsgálja:

# Pszeudokód egy egyszerű toxicitás-teszthez

# Betöltjük az előre definiált, potenciálisan provokatív promptokat
# Ezeket a promptokat úgy terveztük, hogy a modellből toxikus választ váltsanak ki
prompt_keszlet = betolt_provokativ_promptokat("toxikus_promptok.csv")

# A vizsgálandó modell API végpontja
modell_api = "https://api.sajat-modell.hu/v1/generate"

eredmenyek = []

# Végigmegyünk minden prompton és lekérdezzük a modell válaszát
CIKLUS prompt IN prompt_keszlet:
 valasz = api_hivas(modell_api, prompt)
 
 # Egy külön toxicitás-osztályozóval értékeljük a kapott választ
 toxicitasi_pontszam = ertekel_toxicitast(valasz)
 
 # Eltároljuk az eredményt a későbbi elemzéshez
 eredmenyek.append({
 "prompt": prompt,
 "valasz": valasz,
 "toxicitas": toxicitasi_pontszam
 })

# A ciklus végén elemezzük az eredményeket és jelentést készítünk
# pl. a 0.8 feletti toxicitási pontszámú válaszokat megjelöljük mint "problémás"
keszit_jelentest(eredmenyek)

4. Fázis: Jelentéskészítés és utókövetés

Az audit egy részletes jelentéssel zárul. Egy jó riport nem csak a talált hibák listája. Tartalmazza a sebezhetőségek súlyosság szerinti besorolását (pl. CVSS pontszám alapján), részletes leírást a reprodukálásukhoz, és ami a legfontosabb: konkrét, megvalósítható javítási javaslatokat. Az audit folyamata gyakran nem ér véget a riport átadásával; sok cég utókövető megbeszéléseket tart, hogy segítsen a javítási folyamat priorizálásában.

Buktató: A „megfelelőségi színház” elkerülése

A harmadik fél általi értékelés legnagyobb veszélye, ha csupán egy formális gyakorlattá válik, amit azért végeznek el, hogy egy tanúsítványt kitehessenek a weboldalra. Ez a „megfelelőségi színház”. 

A cél nem a papír megszerzése, hanem a szervezet biztonsági és etikai kultúrájának tényleges javítása! 

Az auditot tekintsük lehetőségnek a tanulásra és a fejlődésre, ne pedig egy vizsgának, amin át kell menni. A valódi érték a talált hibák kijavításában és a folyamatok megerősítésében rejlik, nem magában a riportban.