Anthropic stelle neues kostengünstiges Sprachmodell Haiku 4.5 vor

Linux-Magazin

Von: Jens-Christoph Brendel

17. Oktober 2025 um 10:24

Anthropic hat sein neues Sprachmodell Claude Haiku 4.5 vorgestellt.

Ollama 0.12.6 erhält Vulkan-Unterstützung

Linuxnews.de

Von: Ferdinand

16. Oktober 2025 um 05:25

Die Open-Source-Plattform Ollama erlaubt die lokale Ausführung von LLMs. Mit Ollama 0.12.6 kommt experimentelle Unterstützung für Vulkan hinzu, womit sich der Kreis der unterstützten GPUs erweitert.

Rund die Hälfte der Jugendlichen würde bei bestimmten Themen am liebsten mit einer KI sprechen

Linux-Magazin

Von: Jens-Christoph Brendel

10. Oktober 2025 um 11:11

Mehr als ein Viertel aller kann sich eine Freundschaft mit einer KI vorstellen und bei den 16 – 29-Jährigen würde sogar mehr als die Hälfte bei bestimmten Themen lieber mit einer KI…

Neue Kompressionsmethode bringt LLMs auf billigere Hardware

Linux-Magazin

Von: Jens-Christoph Brendel

06. Oktober 2025 um 09:05

Eine neue, von Huawei entwickelte und unter Apache-2.0-Lizenz veröffentlichte Kompressionsmethode macht es möglich, dass große Sprachmodelle auf deutlich kleineren und billigeren Rechnern laufen.

Schweiz stellt eigenes, vollkommen offenes LLM vor

Linux-Magazin

Von: Jens-Christoph Brendel

04. September 2025 um 10:05

Die EPFL (École polytechnique fédérale de Lausanne), die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben ein von ihnen entwickeltes Sprachmodell namens Apertus vorgestellt.

Mit weniger Aufwand zu besseren Antworten

Linux-Magazin

Von: Jens-Christoph Brendel

04. September 2025 um 09:10

Forscher der University of California San Diego und von Meta haben in einem Papier eine neue Methode vorgestellt, um schlussfolgernde Sprachmodelle so zu optimieren, dass sie bessere Antworten…

Einzelne Parameter können ein LLM zerstören

Linux-Magazin

Von: Jens-Christoph Brendel

26. August 2025 um 09:36

Forscher von Apple haben herausgefunden, dass einzelne unter den Milliarden Parametern eines LLM, sogenannte Super Weights, die Sprachfähigkeit des Modells entscheidend beeinflussen oder sogar…

TikTok-Mutter ByteDance veröffentlicht Open-Source-LLM

Linux-Magazin

Von: Jens-Christoph Brendel

21. August 2025 um 07:56

Der TikTok-Mutterkonzern ByteDance hat mit Seed-OSS-36B ein weiteres chinesisches LLM als Open Source veröffentlicht. Es erschien unter der Apache-2.0-Lizenz.

Warum LLMs zwischen Zweifel und Selbstvertrauen schwanken können

Linux-Magazin

Von: Jens-Christoph Brendel

17. Juli 2025 um 08:41

Eine neue Studie von Google und dem University College London untersucht, warum große Sprachmodelle einerseits felsenfest von einer einmal gefundenen Antwort überzeugt sind, sich dann aber sehr…

KI-Müll überlastet Open-Source-Entwickler

Linuxnews.de

Von: Ferdinand

16. Juli 2025 um 07:44

KI ist aus unserem Leben nicht mehr wegzudenken. Ihren wahren Wert muss sie allerdings noch beweisen. Derzeit werden Open-Source-Entwickler vermehrt mit wertlosem KI-Müll überschüttet.

Chinesische Forscher schlagen Memory-OS für KI vor

Linux-Magazin

Von: Jens-Christoph Brendel

09. Juli 2025 um 07:53

Die Forscher verschiedener führender Institute, darunter der Shanghai Jiao Tong University oder des Institute for Advanced Algorithms Research, Shanghai, konstatieren, dass das Fehlen einer gut…

Debian sucht Unterstützung bei KI-Providern

Linuxnews.de

Von: Ferdinand

08. Juli 2025 um 07:23

Debian strebt nach vielen Diskussionen über KI ein Budget für freie Nutzung von LLMs für Entwickler an. Dabei geht es auch um KI-generierten Code.

Verschiedene LLMs bilden Teams – eine Idee aus Japan

Linux-Magazin

Von: Jens-Christoph Brendel

04. Juli 2025 um 08:58

Ein Sprachmodell unterstützt Programmierer besser, ein anderes ist ein Mathe-Ass, ein drittes läuft beim kreativen Schreiben zur Hochform auf – jedes hat seine Stärken und Schwächen.

Neues Open-Source-LLM aus China mit sehr großem Kontextfenster

Linux-Magazin

Von: Jens-Christoph Brendel

17. Juni 2025 um 09:32

Das chinesische Startup MiniMax, bekannt vor allem durch seinen KI-Videogenerator Hailuo, hat nun mit MiniMax-M1 ein großes Sprachmodell unter der Apache-2-Lizenz veröffentlicht, das über ein…

Apple-Studie: Reasoning Modelle doch dümmer als geglaubt

Linux-Magazin

Von: Jens-Christoph Brendel

10. Juni 2025 um 15:07

Im Vorfeld seiner Entwicklerkonferenz WWDC veröffentliche Apple eine Studie unter dem Titel „The Illusion of Thinking“, die prinzipielle Zweifel an der „Denkfähigkeit“…

Startup hilft LLMs zu erkennen, was sie nicht wissen

Linux-Magazin

Von: Jens-Christoph Brendel

03. Juni 2025 um 12:01

Themis AI, eine Ausgründung aus dem MIT, hat Software entwickelt, die es beliebigen Sprachmodellen ermöglichen soll, zu erkennen, was sie nicht wissen oder wo sie zumindest unsicher sind.

Warum sich Chatbots mitunter überlisten lassen

Linux-Magazin

Von: Jens-Christoph Brendel

26. Mai 2025 um 13:49

Wissenschaftler der Princeton Universität und von Google DeepMind haben nun in einem Forschungsbericht gezeigt, warum sich viele Sprachmodelle dazu bringen lassen, gefährliche Inhalte zu…

Wer ist grüner? ChatGPT vs. DeepSeek

Linux-Magazin

Von: Jens-Christoph Brendel

16. Mai 2025 um 08:53

Greenly, ein französisches Unternehmen, das auf die Berechnung von CO2-Bilanzen spezialisiert ist, hat ChatGPT und DeepSeek hinsichtlich ihres ökologischen Fußabdrucks verglichen.

MIT mit neuem Ansatz für Problemlöser-Sprachmodelle

Linux-Magazin

Von: Jens-Christoph Brendel

02. April 2025 um 08:59

Forscher des MIT haben einen neuen Ansatz dafür entwickelt, großen Sprachmodellen das Lösen komplizierter Probleme zu ermöglichen.

Red Hat OpenShift AI bringt Feintuning und mehr

Linux-Magazin

Von: Ulrich Bantle

27. März 2025 um 08:29

Die neueste Version, Red Hat OpenShift AI 2.18, bringt unter anderem End-to-End Model Tuning und distributed Serving.

DeepSeek schockt erneut mit neuem, schnellen, aber sehr genügsamen Modell

Linux-Magazin

Von: Jens-Christoph Brendel

25. März 2025 um 09:53

Ganz ohne Ankündigung und Marketing Tamtam hat DeepSeek sein neues Modell DeepSeek-V3-0324 veröffentlicht, dass auf einem einzelnen Mac Studio performant läuft und zudem unter einer MIT-Lizenz…

Mistral läutet neue Runde im KI-Wettrennen ein

Linux-Magazin

Von: Jens-Christoph Brendel

18. März 2025 um 08:34

Das französische KI-Unternehmen Mistral AI hat ein neues Sprachmodell namens Mistral Small 3.1 vorgestellt, dass mit einem Bruchteil an Parametern (24 Milliarden) die amerikanischen Konkurrenten…

Forscher von Anthropic enttarnen versteckte Ziele einer KI

Linux-Magazin

Von: Jens-Christoph Brendel

14. März 2025 um 09:14

Forscher des KI-Unternehmens Anthropic haben Techniken entwickelt, mit denen sie erkennen können, wann KI-Systeme ihre tatsächlichen Ziele verschleiern.

OpenAI stellt GPT-4.5 „Orion“ vor

Linux-Magazin

Von: Jens-Christoph Brendel

03. März 2025 um 10:53

OpenAI hat sein neuestes und bisher größtes Sprachmodell GPT-4.5 „Orion“ als Forschungsvorschau vorgestellt.

Neue Forschung: LLMs schlussfolgern ähnlich wie Menschen

Linux-Magazin

Von: Jens-Christoph Brendel

19. Februar 2025 um 09:35

Eine neue Studie zeigt, dass LLMs Daten auf der Grundlage ihrer Bedeutung als verschiedene Typen darstellen und über sie in ihrer dominanten Sprache denken.

Lese-Ansicht