🌐 golem.de
Emergent Misalignment: Wenn GPT-4o Menschen versklaven will
Werden LLMs auf Schwachstellen trainiert, zeigen sie plötzlich Fehlverhalten in völlig anderen Bereichen. Forscher warnen vor Risiken.
↗ https://www.golem.de/news/kuenstliche-intelligenz-gpt-4o-zeigt-nach-training-von-schadcode-gewaltphantasien-2601-204259.html