Selbst Top-LLMs schwächeln bei neuem Benchmark für KI-Agenten
25. August 2025 um 09:04
Forscher von Salesforce AI Research haben mit MCP-Universe einen neuen Benchmark entwickelt, der die Leistung von KI-Agenten besser beurteilen soll als bestehende Ansätze.