Fast alle KI-Benchmarks sind mangelhaft
10. November 2025 um 11:16
Ein Team aus 29 Wissenschaftlern hat 445 KI-Benchmarks einer systematischen Untersuchung unterzogen und herausgefunden: Fast alle weisen Mängel auf.
Ein Team aus 29 Wissenschaftlern hat 445 KI-Benchmarks einer systematischen Untersuchung unterzogen und herausgefunden: Fast alle weisen Mängel auf.