🌐 t3n.de
Indiana-Jones-Methode: Forscher zeigen, wie leicht sich KI-Modelle austricksen lassen | t3n
Eine neue Jailbreak-Methode namens Indiana Jones soll zeigen, wie leicht sich große Sprachmodelle austricksen lassen. Wie der Angriff auf LLMs funktioniert und warum die Methode nach dem Filmhelden benannt wurde. Immer wieder suchen KI-Sicherheitsforscher:innen nach Mitteln und Wegen, um die Sicherheitsvorkehrungen großer Sprachmodelle außer Kraft zu setzen. Einige dieser sogenannten Jailbreaks sind sogar in der […]
↗ https://t3n.de/news/indiana-jones-methode-forscher-ki-1674694/