Forscher der Uni Stanford finden Fehler in KI-Benchmarks Linux-Magazin Von: Jens-Christoph Brendel 10. Februar 2026 um 09:38 Fehler in KI-Benchmarks sind nicht ungewöhnlich, können aber die Bewertungen verzerren.