🌐 t3n.de
Pokémon: Wird ein Spieleklassiker zum neuen Benchmark-Test für KI-Modelle? | t3n
Googles Gemini schlägt Claude von Anthropic im ikonischen Spiel Pokémon – zumindest auf den ersten Blick. Ein unfairer Vorteil heizt die Diskussionen um die Aussagekraft von KI-Benchmarks weiter an. Die Kontroverse um KI-Benchmarking hat jetzt auch die populäre Spielereihe Pokémon erreicht. Wie Techcrunch berichtet, soll Googles Gemini in dem Gaming-Klassiker besser abschneiden als Claude von […]
↗ https://t3n.de/news/pokemon-wird-ein-spieleklassiker-zum-neuen-benchmark-test-fuer-ki-modelle-1683408/