🌐 t3n.de
Benchmark-Krise: Wie können wir KI wirklich sinnvoll bewerten? | t3n
Es gibt unzählige Benchmarks für große Sprachmodelle. Aber: Bislang ist keiner gut genug. Es muss ein Wandel her, meint unsere Autorin.
↗ https://t3n.de/news/benchmark-krise-wie-koennen-wir-ki-wirklich-sinnvoll-bewerten-1694274/