Linux-Magazin
Flathub verbietet KI-generierte Inhalte aller Art 02. Juni 2026 um 11:33

Flathub verbietet KI-generierte Inhalte aller Art

02. Juni 2026 um 11:33

Flathub, das zentrale Repository für Flatpak-Apps, hat eine neue Policy eingeführt, der zufolge KI-generierte oder -assistierte Inhalte verboten sind.

Linuxnews.de
Flathub verschärft Regeln für KI-generierten Code 02. Juni 2026 um 07:50

Flathub verschärft Regeln für KI-generierten Code

Linuxnews.de

Von: Ferdinand

02. Juni 2026 um 07:50

Flathub erlässt strengere Regeln für die Einreichung von Apps, bei denen KI zum Einsatz kommt. Aber auch deren Umfeld wie Metadaten und sogar der Pull-Request-Text fallen unter das Verbot.

Linux-Magazin
Hunderte Millionen für Token verschwendet 01. Juni 2026 um 08:51

Hunderte Millionen für Token verschwendet

Linux-Magazin

Von: Jens-Christoph Brendel

01. Juni 2026 um 08:51

Wie das US-Nachrichtenportal Axios berichtet, hat ein namentlich nicht genanntes großes US-Unternehmen innerhalb nur eines Monats bis zu 500 Millionen Dollar für Token an Anthropic für die…

Linux-Magazin
Anthropic erreicht fast eine Billion Firmenwert 29. Mai 2026 um 07:59

Anthropic erreicht fast eine Billion Firmenwert

Linux-Magazin

Von: Jens-Christoph Brendel

29. Mai 2026 um 07:59

Anthropic hat im Rahmen einer Serie-H-Finanzierungsrunde unter der Führung von Altimeter Capital, Dragoneer, Greenoaks und Sequoia Capital 65 Milliarden US-Dollar eingesammelt, wodurch das…

Linux-Magazin
Massenweise halluzinierte Zitate und Quellen in Ernst&Young-Report 28. Mai 2026 um 16:43

Massenweise halluzinierte Zitate und Quellen in Ernst&Young-Report

Linux-Magazin

Von: Jens-Christoph Brendel

28. Mai 2026 um 16:43

In dem Sicherheitsbericht “Uncovering Cyber Threats and Fraud in Loyalty Systems” von Ernst & Young (EY), einem der weltgrößten Beratungsunternehmen, haben Mitarbeiter von…

Koflers Blog
Updates zu lokalen Sprachmodelle: MTP, APEX, Qwopus 28. Mai 2026 um 13:54

Updates zu lokalen Sprachmodelle: MTP, APEX, Qwopus

Koflers Blog

Von: Michael Kofler

28. Mai 2026 um 13:54

Unser Buch Coding mit KI ist gerade erst erschienen, schon gibt es spannende Neuigkeiten rund um die Ausführung lokaler Modelle:

Multi-Token Prediction (MTP) ist ein ganz neues Feature in llama.cpp. Seit ein paar Tagen steht es auch in LM Studio zur Verfügung. Durch einen »Trick« (Details folgen gleich) kann mit MTP die Output-Token-Geschwindigkeit deutlich vergrößert werden: laut diversen Benchmarktests im Internet bis auf das Doppelte, in meinen Tests immerhin um ca. 60 bis 70 Prozent.
Adaptive Precision for EXpert Models (APEX) ist ein neues Verfahren zur besonders platzsparenden Quantisierung von MoE-Modellen. Der Platzbedarf sinkt je nach Qualitätsstufe auf die Hälfte gegenüber der herkömmlichen 4-Bit-Darstellungen (Q4_x_x).
Qwopus ist eine neue Variante zu den Qwen-Modellen, bei denen das Fine Tuning mit Claude Opus verbessert wurde.

Von Speculative Decoding zur Multi-Token Prediction

In Coding mit KI gehe ich kurz auf das Vorgängerkonzept zu MTP ein, auf Speculative Decoding: Dabei führt die Engine (z.B. llama.cpp) zwei Sprachmodelle aus. Das kleinere (schnellere) dient als Draft Model. Während der Token-Generierung macht das Draft Model Vorschläge für die folgenden Token. Das größere, qualitativ bessere Modell überprüft anschließend eine Sequenz mehrerer vorgeschlagener Token auf einmal. Im Idealfall wird die ganze Sequenz akzeptiert. Der Geschwindigkeitsvorteil ergibt sich durch die parallele Verifizierung eines ganzen Token-Blocks. Dazu sind weniger Speicher-Transfers vom VRAM in die GPU notwendig, als wenn jedes Token für sich generiert wird. (Die Token-Generierung wird durch zwei Faktoren limitiert: die Rechenleistung der GPU und die Speicherbandbreite vom VRAM in die GPU-Cores. Speculative Decoding setzt beim zweiten Punkt ein, der oft der limitierende Faktor ist.)

In der Praxis funktioniert das nur mäßig gut: Zum einen ist es schwierig, ein geeignetes Draft Model zu finden. Es muss aus der gleichen »Familie« stammen, aber deutlich kleiner sein, idealerweise etwa um den Faktor zehn. Zum anderen funktioniert Speculative Decoding für Dense Models besser als für Mixture of Experts Models (MoE). Das Problem bei MoE besteht darin, dass bei jedem Token andere »Experten« zum Einsatz kommen können, was den Geschwindigkeitsvorteil von Speculative Decoding teilweise zunichtemacht. Kleinere MoE-Modelle für den Draft-Einsatz haben zudem oft eine andere Experten-Aufteilung, was die Acceptance Rate verringert.

Multi-Token Prediction (MTP) greift die Idee des Speculative Decoding auf. Der entscheidende Unterschied besteht darin, dass ein Modell ausreicht. Ein in das Modell integrierter Layer ist dafür zuständig, rasch ein paar Tokens (üblicherweise 2 bis 4) vorherzusagen. Das Gesamtmodell überprüft dann alle Token auf einmal, was nur unwesentlich mehr Zeit kostet, als ein Token zu berechnen. MTP erspart damit das umständliche Handling mit zwei Modellen.

Speculative Decoding und Multi-Token Prediction sind mit keinerlei Qualitätsverlust verbunden! Es werden exakt die gleichen Ergebnisse erzielt, weil jede Token-Sequenz vollständig kontrolliert und bei Abweichungen verworfen wird. Werfen Sie diesbezüglich einen Blick in das Video von Donata Capitella, das diesen Umstand anschaulich erklärt.

Für den erzielten Geschwindigkeitsgewinn ist der Prozentsatz der akzeptierten Draft Tokens entscheidend. Dieser variiert je Aufgabenstellung: Bei kreativem Text ist die Akzeptanzrate nur mittelmäßig, bei Code hingegen deutlich höher — ganz einfach deswegen, weil Code strengen Regeln folgt und weniger Spielraum als menschliche Sprachen bietet.

Leider ist auch MTP mit Nachteilen verbunden:

Das Modell muss für MTP konzipiert sein. MTP muss schon beim Training berücksichtigt werden. Das Modell benötigt einen zusätzlichen Layer für die Token Prediction. Aktuell gibt es nur eine einzige »freie« Modellfamilie mit MTP, nämlich Qwen 3.6 und dessen Variante Qwopus. Gemma-4-Modelle sollten demnächst folgen. In Zukunft wird MTP wohl zu einem Standard-Feature für freie Modelle.
Natürlich muss auch die Software MTP unterstützen. Weil viele Programme intern llama.cpp verwenden, wird MTP rasch weite Verbreitung finden.
Schließlich teilt sich MTP einen Nachteil mit Speculative Decoding: Es funktioniert bei herkömmlichen Dense-Modellen besser als bei MoE-Modellen (Mixture of Experts). Die ohnedies schon schnellen MoE-Modelle werden also nur geringfügig schneller oder, wie bei einigen meiner Tests, sogar langsamer. Bei den Dense-Modellen ist dagegen eine spürbare Verbesserung zu bemerken. Bei meinen Tests ca. +65%, bei einigen Benchmarks im Internet bis zu +100%, also eine Verdoppelung der Output-Token-Rate.
MTP ändert nichts an der Input-Verarbeitung (dem Prompt Processing, pp). Schneller wird nur der Output (die Token Generation, tg).

Dense versus Mixture of Experts (MoE): MoE ist schneller, kann aber qualitativ bei gleicher Modellgröße nicht ganz mithalten. Während bei Dense-Modellen immer alle Parameter aktiv sind, nutzen MoE-Modelle nur wenige, stets wechselnde »Experten«, also Subsets mit viel weniger Parametern. Das spart Zeit, aber kein »Experte« ist so gut wie das volle Modell. Dementsprechend sinkt die Qualität der Antworten, nicht massiv, aber spürbar.)

Praktische Erfahrungen

Ich habe MTP mit LM Studio 0.4.14 auf meinem Framework Desktop ausprobiert (AMD Ryzen Max 395 CPU/GPU). Mein Mini-Benchmarktests lautete: »Explain Python dictionaries«. Die getesteten Modelle denken über diese Frage eine Weile nach und produzieren dann einen mehrseitigen, qualitativ sehr hochwertigen Text mit eingebauten Code-Schnipseln.

LM Studio mit dem Modell Qwen 3.6 und Multi-Token Prediction (MTP)

Ich habe alle Tests mit einem Kontextfenster von 128.000 Token ausgeführt. Bei den MTP-Modellen habe ich die Einstellung MTP Max Tokens = 3 verwendet, also immer drei Tokens auf einmal erzeugt. Alle getesteten Modelle weisen eine 4-Bit-Quantisierung auf (Ausnahme: das APEX-Modell, siehe unten). Als Backend kommt llama.cpp mit Vulkan zum Einsatz.

                                                            Draft Token 
Modell                     MoE   APEX  MTP   Output (tg)    Acceptance
-----------------          ----  ----  ----  ------------   ------------------
qwen-3.6-27b               nein  nein  nein  12,3 Token/s
qwen-3.6-27b-mtp           nein  nein  ja    20,1 Token/s   66,3 %
qwopus-3.6-27b-v2-mtp      nein  nein  ja    19,0 Token/s   63,7 %

qwen-3.6-35b-a3b           ja    nein  nein  69,7 Token/s
qwen-3.6-35b-a3b-mtp       ja    nein  ja    67,1 Token/s   66,6 %
qwen-3.6-35b-a3b-apex-mtp  ja    ja    ja    71,5 Token/s   63,3 %
qwopus-3.6-35b-a3b-mtp     ja    nein  ja    74,2 Token/s   68,2 %

Professionellere Benchmark-Tests hat Donata Capitella durchgeführt (siehe die ersten zwei Links in den Übersicht der Quellen am Ende des Artikels). Interessanterweise ist dort auch bei MoE-Modellen ein spürbarer Geschwindigkeitszuwachs von etwa 30% zu sehen, den ich bei meinen Tests aber nicht nachvollziehen kann.

Qwopus-Modelle

Die neuen Qwopus-Modelle basieren auf Qwen-Modellen, erhalten aber ein zusätzliches Fine-Tuning mit Claude Opus. Dieses soll den Nachdenkprozess beschleunigen und eine bessere Antwortqualität mit sich bringen. Die erste Versprechung trifft definitiv zu, aber ich bin nicht in der Lage, die Qualität des Modells im Detail zu beurteilen. Subjektiv hatte ich den Eindruck, dass die Unterschiede zu den Qwen-Originalen gering sind.

Zum Denkprozess: Beim Prompt »write a Sudoku solver in Python« denkt qwen-3.6-27b-mtp ca. 1:30 Minuten nach, qwopus-3.6-27b-v2-mtp aber ca. nur 1:00 Minuten. (Die Denkzeit hat eine relativ starke Varianz, weswegen hier genaue Angaben sinnlos sind.) Die resultierende Antwort samt Code ist mehr oder weniger gleichwertig (Backtracking-Algorithmus).

APEX Quantisierung

Die Verkleinerung von Modellen bei möglichst geringen Qualitätsverlust ist zu einer eigenen KI-Disziplin geworden. Die Grundidee besteht darin, Milliarden von Parametern (also eigentlich Fließkommazahlen) mit möglichst wenigen Bits darzustellen, ohne dass die Qualität der Ergebnisse allzu sehr leidet.

Der geringere Platzbedarf von Modellen ist insbesondere dann wichtig, wenn der Speicher (VRAM) limitiert ist. Mit einer geschickten Quantisierung läuft ein Modell vielleicht gerade noch auf einer GPU mit 16 GiB VRAM.

Vor ein paar Monaten machte Google mit dem neuen Turbo-Quant-Verfahren Furore. Bei der Recherche für diesen Artikel bin ich nun auf das neue Verfahren Adaptive Precision for EXpert Models (APEX) gestoßen. Das von Local AI entwickelte Verfahren ist speziell für MoE-Modelle optimiert und kompatibel zu aktuellen llama.cpp-Versionen. Die Grundidee besteht darin, dass für jede Parametergruppe eine andere, für den Wertebereich und die Wichtigkeit angepasste Quantisierung verwendet wird. Insofern ist eine klare Bit-Angabe (4 Bit pro Parameter) unmöglich. Technische Details und Benchmarks finden Sie auf der GitHub-Projektseite. Local AI arbeitet daran, Modelle lokal auf Smartphones auszuführen; da ist die möglichst platzsparende Darstellung natürlich wichtig.

Konkret sind APEX-Modelle zum Teil wirklich erheblich kleiner als vergleichbare Modelle mit Q4-Quantisierung, wie sie bei der lokalen Ausführung von Modellen üblich ist. Die folgende Tabelle zeigt lauter Qwen-3.6-Modelle mit jeweils 35 Milliarden Parameter. Das APEX-MTP-Modell benötigt nur halb so viel Platz wie das MTP-Modell mit einer herkömmlichen Q4-Quantisierung.

Überblick der heruntergeladenen Modelle in LM Studio

Leider verrät die Huggingface-Seite des Modells nicht, welche Variante der APEX-Quantisierung verwendet wurde. Es existieren verschiedene Qualitätsstufen, z.B. Quality, Balanced, Compact und Mini. Ich würde vermuten, das Modell ist eher bei Mini als bei Quality angesiedelt.

Modell                      Quantisierung   Größe (Disk)
------------------------    -------------   ------------
qwen-3.6-35b-a3b            Q4_K_M          22,0 GB
qwen-3.6-35b-a3b-mtp        Q4_K_S          23,0 GB
qwen-3.6-35b-a3b-apex-mtp   APEX            11,7 GB (!)

Bei der Ausführung des Modells waren für mich keine nennenswerten Unterschiede erkennbar, weder in der Geschwindigkeit noch qualitativ. Aber nochmals: Das sind subjektive Feststellungen anhand einiger Tests, keine objektiven Benchmark-Tests. Dazu fehlt mir ganz einfach die Zeit.

Quellen/Links

https://www.youtube.com/watch?v=MI0Pm1d6YF4 (gutes Video von Donata Capitella)
https://kyuz0.github.io/amd-strix-halo-toolboxes/mtp.html (Benchmarks von Donata Capitella)
https://sebastianraschka.com/llm-architecture-gallery/mtp/
https://github.com/ggml-org/llama.cpp/pull/22673 (MTP für llama.cpp)
https://lmstudio.ai/changelog/lmstudio-v0.4.14 (LM Studio Changelog)
https://github.com/localai-org/apex-quant

Ausgewählte Modelle mit MTP und/oder APEX

https://huggingface.co/unsloth/Qwen3.6-35B-A3B-MTP-GGUF (Qwen MTP)
https://huggingface.co/Jackrong/Qwopus3.6-27B-v2-MTP-GGUF (Qwopus MTP)
https://huggingface.co/Jackrong/Qwopus3.6-35B-A3B-v1-MTP-GGUF (ebenso)
https://huggingface.co/mudler/Qwen3.6-35B-A3B-APEX-MTP-GGUF (APEX)

Technisch/Wissenschaftliche Grundlagen

https://arxiv.org/abs/2211.17192 (Speculative Decoding)
https://arxiv.org/abs/2404.19737 (MTP)
https://arxiv.org/abs/2509.18362v1 (FastMTP)
https://arxiv.org/abs/2412.19437 (MTP in DeepSeek-Modellen)
https://blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/ (MTP in Gemma-Modellen)

Linux-Magazin
Ubuntu Summit 26.04: Tempo, Sandkasten und Souveränität 28. Mai 2026 um 13:38

Ubuntu Summit 26.04: Tempo, Sandkasten und Souveränität

Linux-Magazin

Von: Marius Quabeck

28. Mai 2026 um 13:38

Zur Eröffnung des Ubuntu Summit 26.04 formulierten Canonical-CEO Mark Shuttleworth und Engineering-VP Jon Seager das Programm der nächsten Monate: Wie liefert man hochfrequent Software aus, ohne…

Linux-Magazin
Umfrage unter amerikanischen CEOs: So gut wie jeder will Mitarbeiter durch KI ersetzen 28. Mai 2026 um 07:57

Umfrage unter amerikanischen CEOs: So gut wie jeder will Mitarbeiter durch KI ersetzen

Linux-Magazin

Von: Jens-Christoph Brendel

28. Mai 2026 um 07:57

Einer Umfrage der Beratungsfirma Mercer in den USA unter fast 1.000 CEOs diverser Unternehmen zufolge, wollen 99 Prozent in den nächsten zwei Jahren Mitarbeiter durch KI ersetzen.

Linux-Magazin
Origineller Vorschlag zur Prüfung menschengemachter Patches 27. Mai 2026 um 08:12

Origineller Vorschlag zur Prüfung menschengemachter Patches

Linux-Magazin

Von: Jens-Christoph Brendel

27. Mai 2026 um 08:12

Rodrigo Arias Mallo, Maintainer des schnellen Open-Source-Browsers Dillo, hat einen originellen Vorschlag unterbreitet, wie sich überprüfen ließe, ob ein eingereichter Patch nicht von einer KI,…

Linux-Magazin
Anthropic Mitgründer Chris Olah zur Papst-Enzyklika 27. Mai 2026 um 06:59

Anthropic Mitgründer Chris Olah zur Papst-Enzyklika

Linux-Magazin

Von: Jens-Christoph Brendel

27. Mai 2026 um 06:59

Chris Olah, Mitgründer von Anthropic, warnte in einer Rede im Vatikan anlässlich der Präsentation der Enzyklika “Magnifica Humanitas” von Papst Leo XIV zur KI vor kommerziellen…

Linuxnews.de
Linus Torvalds kündigt härteres Vorgehen an 26. Mai 2026 um 04:34

Linus Torvalds kündigt härteres Vorgehen an

Linuxnews.de

Von: Ferdinand

26. Mai 2026 um 04:34

Linus Torvalds bemängelt wieder einmal zu späte Einreichungen von trivialen Korrekturen spät im Entwicklungszyklus und kündigt härteres Vorgehen an.

Linux-Magazin
Google stellt neue Sprachmodelle vor 21. Mai 2026 um 10:08

Google stellt neue Sprachmodelle vor

Linux-Magazin

Von: Jens-Christoph Brendel

21. Mai 2026 um 10:08

Google hat auf seiner Entwicklerkonferenz I/O neue Sprachmodelle vorgestellt. Das bislang leistungsfähigste ist Gemini 3.5 Flash, ein noch stärkeres Pro-Modell soll folgen.

MichlFranken
Red Hat veröffentlicht RHEL 10.2 mit besserer KI Unterstützung 20. Mai 2026 um 15:22

Red Hat veröffentlicht RHEL 10.2 mit besserer KI Unterstützung

MichlFranken

Von: MK

20. Mai 2026 um 15:22

Red Hat stellt zwei neue Versionen seiner Unternehmensdistribution vor. RHEL 10.2 und RHEL 9.8 setzen stark auf moderne KI Werkzeuge. Im Mittelpunkt steht der neue Goose Assistent, der direkt im Terminal hilft. Goose nutzt MCP Integration und liefert farblich verbesserte Ausgaben. Red Hat verspricht schnellere Problemlösungen und einen leichteren Einstieg für neue Administratoren. Beide Versionen […]

Der Beitrag Red Hat veröffentlicht RHEL 10.2 mit besserer KI Unterstützung erschien zuerst auf fosstopia.

MichlFranken
Azure Linux 4.0 wird auf Fedora aufsetzen 20. Mai 2026 um 05:30

Azure Linux 4.0 wird auf Fedora aufsetzen

MichlFranken

Von: MK

20. Mai 2026 um 05:30

Microsoft setzt beim Open Source Summit ein deutliches Zeichen. Der Konzern zeigt neue Linux‑Entwicklungen und präsentiert Werkzeuge für eine Zukunft, die er selbst als AI native beschreibt. Die Richtung ist klar. Microsoft will tiefer in offene Ökosysteme hinein und gleichzeitig eigene Grundlagen für agentenbasierte KI schaffen. Azure Linux erhält einen großen Sprung. Die kommende Version […]

Der Beitrag Azure Linux 4.0 wird auf Fedora aufsetzen erschien zuerst auf fosstopia.

Linux-Magazin
DeepL wechselt zu AWS 19. Mai 2026 um 08:26

DeepL wechselt zu AWS

Linux-Magazin

Von: Jens-Christoph Brendel

19. Mai 2026 um 08:26

Der Kölner Übersetzungsdienst DeepL benutzt zukünftig auch die Cloud-Infrastruktur von Amazon Web Services.

Linux-Magazin
Musk verliert Millionenklage gegen OpenAI vor Gericht 19. Mai 2026 um 07:54

Musk verliert Millionenklage gegen OpenAI vor Gericht

Linux-Magazin

Von: Jens-Christoph Brendel

19. Mai 2026 um 07:54

Die neunköpfige Jury, die im US-Bezirksgericht in Oakland (Kalifornien) weniger als zwei Stunden lang beriet, kam zu dem Schluss, dass Elon Musk seine Klage nicht innerhalb der gesetzlich…

Linuxnews.de
Kernel-Sicherheitsliste mit Bug-Meldungen überschwemmt 18. Mai 2026 um 05:20

Kernel-Sicherheitsliste mit Bug-Meldungen überschwemmt

Linuxnews.de

Von: Ferdinand

18. Mai 2026 um 05:20

KI ist längst auch im Kernel angekommen. Derzeit wird die Sicherheits-Mailingliste des Kernels von Bug-Reports überschwemmt, die mit KI-Tools gefunden und gleich mehrfach gemeldet werden.

Linux-Magazin
Ärzte haften für Falschaussagen ihrer KI 18. Mai 2026 um 15:21

Ärzte haften für Falschaussagen ihrer KI

Linux-Magazin

Von: Jens-Christoph Brendel

18. Mai 2026 um 15:21

In einem Prozess der Verbraucherzentrale NRW gegen die Aesthetify GmbH ging es um die Falschaussagen eines von den Beklagten betriebenen Chatbots, derzufolge die Geschäftsführer der GmbH…

Linux-Magazin
Ubuntu am KI-Scheideweg 18. Mai 2026 um 10:54

Ubuntu am KI-Scheideweg

Linux-Magazin

Von: Michal Kohútek

18. Mai 2026 um 10:54

Ein Kommentar von Michal Kohútek Ende April 2026 hat Jon Seager, Canonicals VP of Engineering, die Pläne für die kommenden Ubuntu-Releases vorgestellt, darunter auch zusätzliche KI-Funktionen und…

Linux-Magazin
Malta schenkt jedem Bürger ChatGPT Plus 18. Mai 2026 um 07:44

Malta schenkt jedem Bürger ChatGPT Plus

Linux-Magazin

Von: Jens-Christoph Brendel

18. Mai 2026 um 07:44

OpenAI und die Regierung von Malta haben ein weltweit einmaliges Abkommen geschlossen, demzufolge der Maltesische Staat jedem Bürger des Landes ein ChatGPT-Plus-Abo spendiert.

MichlFranken
Fedora stoppt überraschend die Pläne für einen eigenen KI Desktop 18. Mai 2026 um 06:00

Fedora stoppt überraschend die Pläne für einen eigenen KI Desktop

MichlFranken

Von: MK

18. Mai 2026 um 06:00

Fedora erlebt gerade eine unerwartete Kehrtwende. Die geplante AI Developer Desktop Initiative liegt auf Eis, nachdem zwei Ratsmitglieder ihre Zustimmung zurückgezogen haben. Die Entscheidung überrascht, denn zuvor galt die Zustimmung als sicher. Der KI Desktop ist damit mehr oder minder abgeräumt. Die Initiative sollte Fedora als starke Plattform für Entwickler im KI Umfeld positionieren. Geplant […]

Der Beitrag Fedora stoppt überraschend die Pläne für einen eigenen KI Desktop erschien zuerst auf fosstopia.

MichlFranken
Red Hat präsentiert zwei neue Linux Desktops für die KI Ära 18. Mai 2026 um 05:30

Red Hat präsentiert zwei neue Linux Desktops für die KI Ära

MichlFranken

Von: MK

18. Mai 2026 um 05:30

Red Hat setzt auf der diesjährigen Summit ein klares Zeichen. Das Unternehmen stellt zwei Desktop Systeme vor, die speziell für Entwickler im KI Umfeld gedacht sind. Beide verfolgen unterschiedliche Ansätze und ergänzen sich dennoch perfekt. Der neue Red Hat Desktop basiert auf einer erweiterten Entwicklerumgebung. Podman Desktop bildet die Grundlage und ermöglicht eine enge Arbeit […]

Der Beitrag Red Hat präsentiert zwei neue Linux Desktops für die KI Ära erschien zuerst auf fosstopia.

Linuxnews.de
Fedora KI Developer Desktop blockiert 15. Mai 2026 um 05:11

Fedora KI Developer Desktop blockiert

Linuxnews.de

Von: Ferdinand

15. Mai 2026 um 05:11

Das Fedora-Leitungsgremium entschied vergangene Woche einstimmig zugunsten eines Vorschlags für einen Fedora AI Developer Desktop. Mittlerweile ist das Ticket blockeirt.

Linux-Magazin
Google will KI via Mauszeiger steuern 13. Mai 2026 um 09:19

Google will KI via Mauszeiger steuern

Linux-Magazin

Von: Jens-Christoph Brendel

13. Mai 2026 um 09:19

Der bislang über Jahrzehnte unverändert gebliebene Mauszeiger soll laut Google neue KI-Funktionen übernehmen, indem er Inhalte und Kontexte erfasst, auf die er zeigt.

MichlFranken
Fedora plant eigene AI Desktops und setzt klaren Kurs 13. Mai 2026 um 06:00

Fedora plant eigene AI Desktops und setzt klaren Kurs

MichlFranken

Von: MK

13. Mai 2026 um 06:00

Die Diskussion um künstliche Intelligenz erreicht nun auch Fedora. Die Community hat einer Initiative zugestimmt, die spezielle AI Varianten der Fedora Atomic Desktops schaffen soll. Das Projekt trägt den Namen Fedora AI Developer Desktop und erhielt volle Unterstützung im Fedora Council. Die Idee stammt von Gordon Messmer aus dem Packaging Team. Sein Vorschlag soll Entwicklern […]

Der Beitrag Fedora plant eigene AI Desktops und setzt klaren Kurs erschien zuerst auf fosstopia.

Normale Ansicht

Von Speculative Decoding zur Multi-Token Prediction

Praktische Erfahrungen

Qwopus-Modelle

APEX Quantisierung

Quellen/Links