🌐 t3n.de
OpenAI-Test zeigt: Selbst die besten Modelle geben oft falsche Antworten | t3n
OpenAI hat einen neuen Benchmark-Test entwickelt, um die Genauigkeit aktueller KI-Modelle zu überprüfen. Dabei lieferten sogar die Spitzenmodelle oft falsche Antworten. OpenAI hat unter dem Titel „SimpleQA“ einen Benchmark-Test entwickelt, um die Antwortgenauigkeit eigener und konkurrierender KI-Modelle zu überprüfen. Dabei geht es um Fragen, für die es nur eine korrekte Antwort gibt. In einem Paper […]
↗ https://t3n.de/news/openai-test-zeigt-selbst-die-besten-modelle-geben-oft-falsche-antworten-1655229/