Spitzen-Sprachmodelle scheitern an Aufgaben, die Kleinkinder lösen
Während multimodale LLMs heute Textaufgaben auf Doktorandenniveau lösen können, versagen sie bei visuellen Aufgaben, die Kleinkinder im Alter von drei bis fünf Jahren beherrschen.
Während multimodale LLMs heute Textaufgaben auf Doktorandenniveau lösen können, versagen sie bei visuellen Aufgaben, die Kleinkinder im Alter von drei bis fünf Jahren beherrschen.
Mit Open Responses gibt es nun erstmals einen Vorschlag für einen Open-Source-Standard für ein herstellerunabhängiges JSON-API, über das Clients mit LLMs kommunizieren können.
Clem Delangue, der Mitbegründer und CEO von Hugging Face, der bekannten Plattform für KI-Modelle, sieht die Gefahr, dass bereits im nächsten Jahr eine Blase platzt.
Große Sprachmodelle (LLMs) sind leistungsstark, aber statisch – ihnen fehlten bislang Mechanismen, um ihre Gewichte an neue Aufgaben, Kenntnisse oder Beispiele anzupassen.
Das 2022 gegründete chinesische KI-Startup MiniMax sorgt mit seinem Modell M2 für Aufsehen, das sich auf Anhieb unter die Top-5 aller Sprachmodelle einreiht und nur 8 Prozent dessen kosten soll,…
Anthropic hat sein neues Sprachmodell Claude Haiku 4.5 vorgestellt.
Die Open-Source-Plattform Ollama erlaubt die lokale Ausführung von LLMs. Mit Ollama 0.12.6 kommt experimentelle Unterstützung für Vulkan hinzu, womit sich der Kreis der unterstützten GPUs erweitert.
Mehr als ein Viertel aller kann sich eine Freundschaft mit einer KI vorstellen und bei den 16 – 29-Jährigen würde sogar mehr als die Hälfte bei bestimmten Themen lieber mit einer KI…
Eine neue, von Huawei entwickelte und unter Apache-2.0-Lizenz veröffentlichte Kompressionsmethode macht es möglich, dass große Sprachmodelle auf deutlich kleineren und billigeren Rechnern laufen.
Die EPFL (École polytechnique fédérale de Lausanne), die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben ein von ihnen entwickeltes Sprachmodell namens Apertus vorgestellt.
Forscher der University of California San Diego und von Meta haben in einem Papier eine neue Methode vorgestellt, um schlussfolgernde Sprachmodelle so zu optimieren, dass sie bessere Antworten…
Forscher von Apple haben herausgefunden, dass einzelne unter den Milliarden Parametern eines LLM, sogenannte Super Weights, die Sprachfähigkeit des Modells entscheidend beeinflussen oder sogar…
Der TikTok-Mutterkonzern ByteDance hat mit Seed-OSS-36B ein weiteres chinesisches LLM als Open Source veröffentlicht. Es erschien unter der Apache-2.0-Lizenz.
Eine neue Studie von Google und dem University College London untersucht, warum große Sprachmodelle einerseits felsenfest von einer einmal gefundenen Antwort überzeugt sind, sich dann aber sehr…
KI ist aus unserem Leben nicht mehr wegzudenken. Ihren wahren Wert muss sie allerdings noch beweisen. Derzeit werden Open-Source-Entwickler vermehrt mit wertlosem KI-Müll überschüttet.
Die Forscher verschiedener führender Institute, darunter der Shanghai Jiao Tong University oder des Institute for Advanced Algorithms Research, Shanghai, konstatieren, dass das Fehlen einer gut…
Debian strebt nach vielen Diskussionen über KI ein Budget für freie Nutzung von LLMs für Entwickler an. Dabei geht es auch um KI-generierten Code.
Ein Sprachmodell unterstützt Programmierer besser, ein anderes ist ein Mathe-Ass, ein drittes läuft beim kreativen Schreiben zur Hochform auf – jedes hat seine Stärken und Schwächen.
Das chinesische Startup MiniMax, bekannt vor allem durch seinen KI-Videogenerator Hailuo, hat nun mit MiniMax-M1 ein großes Sprachmodell unter der Apache-2-Lizenz veröffentlicht, das über ein…
Im Vorfeld seiner Entwicklerkonferenz WWDC veröffentliche Apple eine Studie unter dem Titel „The Illusion of Thinking“, die prinzipielle Zweifel an der „Denkfähigkeit“…
Themis AI, eine Ausgründung aus dem MIT, hat Software entwickelt, die es beliebigen Sprachmodellen ermöglichen soll, zu erkennen, was sie nicht wissen oder wo sie zumindest unsicher sind.
Wissenschaftler der Princeton Universität und von Google DeepMind haben nun in einem Forschungsbericht gezeigt, warum sich viele Sprachmodelle dazu bringen lassen, gefährliche Inhalte zu…
Greenly, ein französisches Unternehmen, das auf die Berechnung von CO2-Bilanzen spezialisiert ist, hat ChatGPT und DeepSeek hinsichtlich ihres ökologischen Fußabdrucks verglichen.
Forscher des MIT haben einen neuen Ansatz dafür entwickelt, großen Sprachmodellen das Lösen komplizierter Probleme zu ermöglichen.
Die neueste Version, Red Hat OpenShift AI 2.18, bringt unter anderem End-to-End Model Tuning und distributed Serving.