Könnyebb rávenni bűnre a mesterséges intelligenciát, mint gondolná

Mindössze 250 fájl és kész.

Az Anthropic, az amerikai mesterséges intelligenciával foglalkozó vállalat, amely nagy nyelvi modellek biztonságára specializálódott, új kutatást publikált a nyelvi modellek adatmérgezéses sebezhetőségéről, a brit AI Security Institute és az Alan Turing Institute együttműködésével.

A vizsgálat szerint mindössze 250 rosszindulatú dokumentum elegendő ahhoz, hogy hátsó kaput (backdoor) hozzanak létre egy nagy nyelvi modellben, függetlenül a modell méretétől vagy a tanítóadat mennyiségétől. Ez azt jelenti, hogy az adatmérgezéses támadások sokkal könnyebben kivitelezhetők, mint korábban gondolták.

A fotó illusztráció: Shutterstock

A kutatás a Claude-hoz hasonló, nagyméretű nyelvi modelleket vizsgálta, amelyek az interneten található hatalmas mennyiségű nyilvános szövegből tanulnak (Claude egy ilyen fejlett AI-chatmodell). Rosszindulatú szereplők így célzottan mérgezett tartalmat juttathatnak be, ami a modell nem kívánt viselkedését idézheti elő.

A vizsgálat kimutatta, hogy a mérgezett dokumentumok száma szinte állandó, akár egy 600 millió, akár egy 13 milliárd paraméteres modellről van szó. A kutatók hangsúlyozzák: ez a jelenség nagyobb kockázatot jelenthet a jövőben, és további vizsgálatokat igényel a védekezési stratégiák kidolgozásához.

2025. október 10. 19:26
Szállodahajó ütközött egy állóhajónak Esztergomnál, erről a város polgármestere osztott meg fotókat a minap.
Az elkövetkező hetekben és hónapokban komoly brüsszeli nyomás várható Magyarországgal szemben annak érdekében, hogy ...
A tét óriási, Brüsszel a háború és Ukrajna finanszírozására durva adóemeléseket akar ránk kényszeríteni, a magyar el...
Egy gyerek is utazott abban az autóban, ami kigyulladt csütörtök este Hódmezővásárhely közelében.
CUNAMIRIADÓ! - Óriási a pánik, emberek ezreit evakuálják, brutális erősségű földrengés rázta meg a Fülöp-szigeteket,...
family
HALÁLOS - Halálba vitte a feleségét egy férfi Törökszentmiklósnál. Egy elhibázott előzés miatt ütköztek egy másik au...
A 2000-es évek elején robbant be Magyarországon a NOX, forradalmi stílusával pillanatok alatt milliók kedvence lett....
family
Négy lánya van három nőtől, nem tud hűséges lenni a Hooligans dobosa, a legutóbbi tejfakasztó bulija pedig nyolc nap...
family