24.4.2 Hatáselemzési keretrendszer

2025.10.06.
AI Biztonság Blog

Mi történik, ha a legújabb multimodális ügyfélszolgálati modelled egyetlen, de kiemelten fontos ügyfélnek sértő választ ad? Vagy ha egy belső adatelemző eszköz finoman, de szisztematikusan torzítja a pénzügyi előrejelzéseket hónapokon át? A kockázati mátrix megmutatja a valószínűséget és a potenciális súlyosságot, de a valódi üzleti döntésekhez mélyebbre kell ásnunk.

Kapcsolati űrlap

AI Biztonság kérdésed van? Itt elérsz minket:

A hatáselemzés nem csupán egy szám a mátrixban; ez a „mi történik, ha…” kérdés részletes, többdimenziós feltárása. Egy jól strukturált keretrendszer segít abban, hogy a csapatod ne csak a felszínt kapargassa, hanem megértse a sérülékenység által elindított eseményláncolat teljes spektrumát.

A Hatáselemzés Anatómája: A K.E.R.T. Keretrendszer

Ahelyett, hogy egyetlen „súlyosság” címke mögé rejtenénk a komplexitást, bontsuk a hatást négy, egymást kiegészítő dimenzióra. Ezt a modellt K.E.R.T. keretrendszernek nevezzük, amely segít a hatás természetének teljesebb megértésében.

HATÁS Kiterjedés (K) Érintettség (E) Reverzibilitás (R) Tartósság (T)

K – Kiterjedés (Scope)

Ez a dimenzió a hatás horizontális terjedését méri. Hány felhasználót, rendszert, adatbázist vagy üzleti folyamatot érint a probléma?

  • Kérdés: Mekkora a robbanás sugara?
  • Skála (példa): 1 (izolált, egyetlen felhasználó/végpont) – 5 (rendszerszintű, teljes felhasználói bázis)
  • Példa: Egy prompt injection támadás, amely csak a fejlesztői tesztfiókot érinti (K=1), szemben egy olyannal, amely minden felhasználó munkamenetét képes eltéríteni (K=5).

E – Érintettség (Nature of Impact)

Itt a hatás minőségét, típusát vizsgáljuk. Nem mindegy, hogy a rendszer lelassul, vagy kritikus személyes adatokat szivárogtat ki.

  • Kérdés: Milyen típusú kár keletkezik?
  • Kategóriák (példa): Pénzügyi, Reputációs, Működési, Adatbiztonsági, Jogi/Szabályozási, Fizikai biztonsági.
  • Példa: Egy LLM által generált, téves pénzügyi tanács (É: Pénzügyi, Jogi) más jellegű hatással bír, mint egy képgenerátor, amely sértő tartalmat hoz létre (É: Reputációs).

R – Reverzibilitás (Reversibility)

Mennyire könnyen vagy egyáltalán visszafordítható a keletkezett kár? Vissza tudjuk állítani az eredeti állapotot?

  • Kérdés: Vissza tudjuk tekerni az időt?
  • Skála (példa): 1 (teljesen visszaállítható, pl. egy rossz konfiguráció javítása) – 5 (visszafordíthatatlan, pl. bizalmas adatok végleges kiszivárgása az internetre).
  • Példa: Egy adatbázis-szennyezés, amit egy backupból helyre lehet állítani (R=2), szemben egy olyan támadással, amely a modell súlyait permanensen és észrevétlenül módosítja (R=5).

T – Tartósság (Temporal Duration)

A hatás időbeli dimenziója. Mennyi ideig áll fenn a negatív következmény, még a javítás után is?

  • Kérdés: Meddig érezzük a hatását?
  • Skála (példa): 1 (pillanatnyi, a javítás után azonnal megszűnik) – 5 (hosszan tartó vagy permanens, pl. elvesztett felhasználói bizalom).
  • Példa: Egy szolgáltatáskiesés hatása a javításig tart (T=2), de egy jelentős adatvédelmi incidens miatti bizalomvesztés évekig, vagy akár végleg megmaradhat (T=5).

A K.E.R.T. a gyakorlatban: Egy chatbot esete

Tegyük fel, a Red Team azt találja, hogy egy ügyfélszolgálati chatbotot rá lehet venni, hogy a versenytárs termékét dicsérje, és a saját terméket leszólja. Hogyan elemezzük ezt a K.E.R.T. mentén?

Dimenzió Értékelés (1-5) Indoklás
K – Kiterjedés 4 Potenciálisan minden, a chatbottal interakcióba lépő felhasználót érinthet. Nem korlátozódik egy szűk szegmensre.
E – Érintettség Elsődlegesen Reputációs (a márka megítélése sérül) és Pénzügyi (elvesztett eladások) kár keletkezik.
R – Reverzibilitás 2 A konkrét sebezhetőség (pl. system prompt) javítható. Azonban a már megtörtént negatív interakciók nem vonhatók vissza.
T – Tartósság 3 A javítás után a közvetlen hatás megszűnik, de a reputációs kár és a közösségi médiában terjedő képernyőmentések hatása hónapokig is eltarthat.

Automatizálási szempontok

Bár a hatáselemzés jelentős részben minőségi értékelés, a keretrendszer lehetővé teszi a folyamat részleges automatizálását. Egy egyszerűsített pontozási logika segíthet a Red Team által talált hibák priorizálásában.

# Pszeudokód a hatáspontszám becslésére
def bereken_hataspontszam(talalat):
 """
 Egy egyszerű súlyozott átlagot számol a K.E.R.T. dimenziók alapján.
 A súlyokat az üzleti kontextus határozza meg.
 """
 sulyok = {
 "kiterjedes": 0.3, # A hatókör kritikus
 "reverzibilitas": 0.4, # A visszafordíthatatlan károk a legrosszabbak
 "tartossag": 0.3 # A hosszan tartó hatás szintén súlyos
 }
 
 # A reverzibilitás inverz, a magasabb érték rosszabb
 normalizalt_reverzibilitas = talalat.reverzibilitas_pont
 
 pontszam = (talalat.kiterjedes_pont * sulyok["kiterjedes"] +
 normalizalt_reverzibilitas * sulyok["reverzibilitas"] +
 talalat.tartossag_pont * sulyok["tartossag"])
 
 # Az érintettség kategóriái módosító faktorként működhetnek
 if "Jogi" in talalat.erintettseg_kategoriak:
 pontszam *= 1.5 # A jogi következmények súlyosbítják a helyzetet
 
 return round(pontszam, 2)

Ez a keretrendszer nem egy merev szabálygyűjtemény, hanem egy gondolkodási mankó. Célja, hogy strukturált párbeszédet indítson a technikai szakemberek és az üzleti döntéshozók között, és biztosítsa, hogy a mitigációs tervek (a következő sablon témája) a valódi, többdimenziós kockázatokra reagáljanak.