🌐 t3n.de

Anthropic-Studie: So leicht lässt sich KI täuschen | t3n

Große Sprachmodelle lassen sich offenbar sehr leicht manipulieren. Zu diesem Ergebnis ist Anthropic, Hersteller des KI-Chatbots Claude, in einer neuen Studie gekommen. Große Sprachmodelle lassen sich leicht „jailbreaken“, behaupten Anthropics Forscher:innen. Dabei ist Jailbreaken in diesem Kontext so zu verstehen, dass die KI-Modelle auf einfache Weise dazu bewegt werden können, ihre eigenen Leitplanken zu ignorieren. […]

↗ https://t3n.de/news/anthropic-studie-so-leicht-laesst-sich-ki-taeuschen-1665461/

t3n news anthropic studie leicht laesst sich taeuschen

Indexiert von findnix.eu · Eigene Seite einreichen