🌐 t3n.de
KI-Benchmarks: Leistungsmesser oder Marketing-Hype für Meta, OpenAI und Co.? | t3n
Benchmarks sollen die Leistung von großen Sprachmodellen objektiv bestimmen. Häufig haben sie aber keinen Bezug dazu, wie KI-Tools in der echten Welt benutzt werden oder sind schlicht veraltet. Damit Benchmarks relevant bleiben, muss sich das ändern. Als Meta am 5. April sein neuestes Open-Weights-Modell Llama 4 in drei Varianten veröffentlicht, scheint die Freude groß. Denn […]
↗ https://t3n.de/news/ki-benchmarks-leistungsmesser-marketing-hype-openai-meta-1684097/