❌

Lese-Ansicht

Neuer Mathe-Benchmark lässt führende KIs scheitern

13. November 2024 um 10:03

Das Forschungsinstitut Epoch AI hat mit FrontierMath einen neuen Benchmark vorgestellt, an dem führende Systeme wie Claude 3.5 Sonnet, GPT-4o, o1-preview oder Gemini 1.5 Pro reihenweise…