Forscher der Uni Stanford finden Fehler in KI-Benchmarks
10. Februar 2026 um 09:38
Fehler in KI-Benchmarks sind nicht ungewöhnlich, können aber die Bewertungen verzerren.
Fehler in KI-Benchmarks sind nicht ungewöhnlich, können aber die Bewertungen verzerren.