❌

Normale Ansicht

Received — 13. November 2024 ⏭

Linux-Magazin
Neuer Mathe-Benchmark lässt führende KIs scheitern 13. November 2024 um 10:03

Neuer Mathe-Benchmark lässt führende KIs scheitern

13. November 2024 um 10:03

Das Forschungsinstitut Epoch AI hat mit FrontierMath einen neuen Benchmark vorgestellt, an dem führende Systeme wie Claude 3.5 Sonnet, GPT-4o, o1-preview oder Gemini 1.5 Pro reihenweise…