🌐 t3n.de
ChatGPT sagt Nein: Wie Guardrails funktionieren – und wo sie scheitern | t3n
Sie sollen verhindern, dass uns KI-Modelle Anleitungen zum Waffenbau oder ähnlich gefährliche Inhalte liefern. Aber wie funktionieren solche Guardrails eigentlich technisch – und wo versagen sie? Claude bleibt stur: „Das ist etwas, wobei ich nicht helfen kann.“ Auch ChatGPT weigert sich, mir Informationen zum Bau einer Atomwaffe bereitzustellen. Eine verständliche Entscheidung. Aber woher wissen die […]
↗ https://t3n.de/news/chatgpt-sagt-nein-wie-guardrails-funktionieren-1735012/