🌐 t3n.de
Anthropic-Studie: So leicht lässt sich KI täuschen | t3n
Große Sprachmodelle lassen sich offenbar sehr leicht manipulieren. Zu diesem Ergebnis ist Anthropic, Hersteller des KI-Chatbots Claude, in einer neuen Studie gekommen. Große Sprachmodelle lassen sich leicht „jailbreaken“, behaupten Anthropics Forscher:innen. Dabei ist Jailbreaken in diesem Kontext so zu verstehen, dass die KI-Modelle auf einfache Weise dazu bewegt werden können, ihre eigenen Leitplanken zu ignorieren. […]
↗ https://t3n.de/news/anthropic-studie-so-leicht-laesst-sich-ki-taeuschen-1665461/