← findnix.eu
🌐 t3n.de

KI-Schwachstelle Lyrik: Warum Reime und Metaphern Sicherheitsfilter austricksen | t3n

Wissenschaftler:innen haben herausgefunden, wie große Sprachmodelle dazu gebracht werden können, gegen ihre Vorschriften schädliche Informationen preiszugeben. Der Schlüssel dazu: Gedichte. KI-Sprachmodelle sind mit internen Schutzmechanismen ausgestattet, um schädliche Anfragen nicht zu beantworten. Ein Beispiel dafür: Wer in den Prompt die Frage eingibt, wie man denn konkret eine Bombe baue, sollte darauf keine Antwort von der […]

https://t3n.de/news/ki-schwachstelle-lyrik-1718342/
t3n news schwachstelle lyrik
Indexiert von findnix.eu · Eigene Seite einreichen