❌

Normale Ansicht

Empfangen — 25. August 2025 ⏭ News

Linux-Magazin
Selbst Top-LLMs schwächeln bei neuem Benchmark für KI-Agenten 25. August 2025 um 09:04

Selbst Top-LLMs schwächeln bei neuem Benchmark für KI-Agenten

25. August 2025 um 09:04

Forscher von Salesforce AI Research haben mit MCP-Universe einen neuen Benchmark entwickelt, der die Leistung von KI-Agenten besser beurteilen soll als bestehende Ansätze.