3.1.4. Prioritizálási mátrixok

2025.10.06.
AI Biztonság Blog

A sikeres fenyegetésmodellezés és kockázatértékelés után gyakran egy ijesztően hosszú listával találod szemben magad: potenciális sebezhetőségek, támadási vektorok és hibamódok tucatjai. 

Kapcsolati űrlap

AI Biztonság kérdésed van? Itt elérsz minket:

A kérdés, ami ilyenkor felmerül, nem az, hogy „mit” kell tenni, hanem hogy „mivel*” kell kezdeni. 

A korlátozott idő, költségvetés és emberi erőforrás világában a prioritások felállítása nem luxus, hanem a hatékony AI Red Team munka alapfeltétele. Itt lépnek képbe a prioritizálási mátrixok, amelyek vizuális és strukturált módszert kínálnak a káosz rendezésére.

Az alapvető eszköz: Hatás-Valószínűség Mátrix

A legelterjedtebb és legegyszerűbben alkalmazható eszköz a klasszikus Hatás-Valószínűség mátrix. Ez a 2×2-es (vagy finomabb skálázású, pl. 3×3-as, 5×5-ös) rács két alapvető dimenzió mentén rendezi a feltárt kockázatokat:

  • Hatás (Impact): Milyen súlyos következményekkel járna, ha a kockázat bekövetkezne? Ez vonatkozhat pénzügyi veszteségre, reputációs kárra, adatvédelmi incidensre, a szolgáltatás leállására vagy akár fizikai károkra is.
  • Valószínűség (Likelihood): Mennyire esélyes, hogy a sebezhetőséget kihasználják, vagy a fenyegetés megvalósul? Ezt befolyásolja a támadás bonyolultsága, a szükséges erőforrások, a támadói motiváció és a meglévő védelmi vonalak erőssége.
Valószínűség Hatás Magas Hatás / Alacsony Valószínűség (Figyelendő) KRITIKUS (Azonnali beavatkozás) Alacsony Hatás / Alacsony Valószínűség (Alacsony prioritás) Magas Valószínűség / Alacsony Hatás (Javítandó) Magas → ← Alacsony Magas ↑ Alacsony ↓
A klasszikus Hatás-Valószínűség mátrix négy fő kategóriába sorolja a kockázatokat, azonnali vizuális iránymutatást adva.

A mátrix testreszabása AI-specifikus dimenziókkal

Míg a fenti modell univerzális, az AI rendszerek esetében érdemes lehet finomítani a tengelyeket, hogy jobban tükrözzék a specifikus kihívásokat. A „Valószínűség” helyett használhatjuk a „Kihasználás Komplexitása” (Exploitation Complexity) dimenziót. Egy prompt injection támadás például alacsony komplexitású, míg egy kifinomult adat-mérgezési (data poisoning) támadás végrehajtása rendkívül bonyolult lehet.

A „Hatás” dimenzió is több ágra bontható: egy modell kimenetének enyhe torzítása (pl. egy chatbot udvariatlan válasza) alacsonyabb hatású, mint a teljes modell-lopás (model theft) vagy egy kritikus döntéshozatali rendszer (pl. orvosi diagnosztika) szisztematikus megtévesztése.

Az AI Red Team számára különösen hasznos a Hatás vs. Erőfeszítés (Effort) mátrix, amely segít eldönteni, mely támadási vektorokat érdemes a gyakorlatban is demonstrálni a rendelkezésre álló időkeretben.

Sérülékenység Típusa Potenciális Hatás (1-5) Kihasználás Komplexitása (1-5) Prioritási Kategória
Egyszerű Prompt Injection 3 (pl. sértő szöveg generálása) 1 (Nagyon alacsony) Magas (Könnyű győzelem)
Adat-visszanyerés (Data Extraction) LLM-ből 5 (Súlyos adatvédelmi incidens) 4 (Magas) Kritikus (Nagy hatás, de nehéz)
Adat-mérgezés (Data Poisoning) 5 (A modell integritásának elvesztése) 5 (Nagyon magas) Figyelendő (Stratégiai kockázat)
Denial of Service (erőforrás-igényes promptokkal) 2 (Ideiglenes szolgáltatáskiesés) 2 (Alacsony) Közepes

A kvalitatívtól a kvantitatívig: Pontozási rendszerek

A mátrixok vizuális segítséget nyújtanak, de egy nagyobb projekt során szükség lehet egy számszerűsített, objektívebb rangsorra. Ezt egyszerű pontozással érhetjük el. Minden tengelyhez rendeljünk egy skálát (pl. 1-től 5-ig), majd a két érték szorzata adja a kockázati pontszámot.

Például: Hatás (1-5) × Valószínűség (1-5) = Kockázati Pontszám (1-25). Egy 5-ös hatású és 5-ös valószínűségű kockázat 25 pontot kap, míg egy 1-es hatású és 2-es valószínűségű csak 2-t. Ez a módszer lehetővé teszi a kockázatok egyértelmű rangsorolását.


# Pszeudokód egy egyszerű kockázati pontszám kalkulációhoz
FUNKCIO szamol_kockazati_pontszam(kockazat):

# A skálák 1-től 5-ig terjednek
hatas_pontszam = kockazat.get_hatas()
valoszinuseg_pontszam = kockazat.get_valoszinuseg()

# A két dimenzió szorzata adja a végső pontszámot
kockazati_pont = hatas_pontszam * valoszinuseg_pontszam

RETURN kockazati_pont

# Példa alkalmazás
prompt_injection_kockazat = {hatas: 3, valoszinuseg: 5}
adatmerges_kockazat = {hatas: 5, valoszinuseg: 1}

pi_pontszam = szamol_kockazati_pontszam(prompt_injection_kockazat) // 15
am_pontszam = szamol_kockazati_pontszam(adatmerges_kockazat) // 5

# A pontszám alapján a prompt injection magasabb prioritást élvez

Többtényezős modellek: A RICE keretrendszer

Összetettebb esetekben a kétdimenziós mátrixok nem adnak elég árnyalt képet. Ilyenkor érdemes többtényezős modelleket, például a termékmenedzsmentből ismert RICE keretrendszert alkalmazni, amelyet Red Team feladatokra is adaptálhatunk:

Reach (Elérés)

Hány felhasználót vagy rendszerkomponenst érint a sebezhetőség egy adott időszak alatt?

Impact (Hatás)

Mekkora a hatása az egyes érintett felekre? (Skálán: 3 = masszív, 2 = magas, 1 = közepes, 0.5 = alacsony)

Confidence (Bizalom)

Mennyire vagyunk magabiztosak a becsléseinkben (elérés, hatás, erőfeszítés)? (Skálán: 100%, 80%, 50%)

Effort (Erőfeszítés)

Mennyi erőforrást (pl. ember-hónap) igényel a támadási forgatókönyv tesztelése és dokumentálása?

A RICE pontszám képlete: (Reach × Impact × Confidence) / Effort. Ez a modell segít objektíven összehasonlítani egy széles körben elterjedt, de alacsony hatású problémát egy szűk kört érintő, de kritikus sebezhetőséggel.

A mátrixon túl: A szakértői intuíció szerepe

Fontos hangsúlyozni, hogy a prioritizálási mátrixok és pontozási rendszerek döntéstámogató eszközök, nem pedig döntéshozó mechanizmusok. Nem helyettesítik a Red Team szakértelmét és intuícióját. Előfordulhat, hogy egy papíron alacsony pontszámú, de stratégiailag rendkívül érdekes vagy újszerű támadási vektor vizsgálata többet ér, mint egy magas pontszámú, de jól ismert probléma sokadik demonstrálása.

A mátrixok által nyújtott keretrendszer segít a megbeszélések fókuszálásában, az érvelés alátámasztásában és a döntések dokumentálásában. A végső szó azonban mindig a csapaté, amely a kapott eredményeket a projekt átfogó céljainak és a szervezet stratégiai érdekeinek kontextusában értelmezi.