Warum sich Chatbots mitunter überlisten lassen

26. Mai 2025 um 13:49

Wissenschaftler der Princeton Universität und von Google DeepMind haben nun in einem Forschungsbericht gezeigt, warum sich viele Sprachmodelle dazu bringen lassen, gefährliche Inhalte zu…

Wer ist grüner? ChatGPT vs. DeepSeek

Linux-Magazin

Von: Jens-Christoph Brendel

16. Mai 2025 um 08:53

Greenly, ein französisches Unternehmen, das auf die Berechnung von CO2-Bilanzen spezialisiert ist, hat ChatGPT und DeepSeek hinsichtlich ihres ökologischen Fußabdrucks verglichen.

MIT mit neuem Ansatz für Problemlöser-Sprachmodelle

Linux-Magazin

Von: Jens-Christoph Brendel

02. April 2025 um 08:59

Forscher des MIT haben einen neuen Ansatz dafür entwickelt, großen Sprachmodellen das Lösen komplizierter Probleme zu ermöglichen.

Red Hat OpenShift AI bringt Feintuning und mehr

Linux-Magazin

Von: Ulrich Bantle

27. März 2025 um 08:29

Die neueste Version, Red Hat OpenShift AI 2.18, bringt unter anderem End-to-End Model Tuning und distributed Serving.

DeepSeek schockt erneut mit neuem, schnellen, aber sehr genügsamen Modell

Linux-Magazin

Von: Jens-Christoph Brendel

25. März 2025 um 09:53

Ganz ohne Ankündigung und Marketing Tamtam hat DeepSeek sein neues Modell DeepSeek-V3-0324 veröffentlicht, dass auf einem einzelnen Mac Studio performant läuft und zudem unter einer MIT-Lizenz…

Mistral läutet neue Runde im KI-Wettrennen ein

Linux-Magazin

Von: Jens-Christoph Brendel

18. März 2025 um 08:34

Das französische KI-Unternehmen Mistral AI hat ein neues Sprachmodell namens Mistral Small 3.1 vorgestellt, dass mit einem Bruchteil an Parametern (24 Milliarden) die amerikanischen Konkurrenten…

Forscher von Anthropic enttarnen versteckte Ziele einer KI

Linux-Magazin

Von: Jens-Christoph Brendel

14. März 2025 um 09:14

Forscher des KI-Unternehmens Anthropic haben Techniken entwickelt, mit denen sie erkennen können, wann KI-Systeme ihre tatsächlichen Ziele verschleiern.

OpenAI stellt GPT-4.5 „Orion“ vor

Linux-Magazin

Von: Jens-Christoph Brendel

03. März 2025 um 10:53

OpenAI hat sein neuestes und bisher größtes Sprachmodell GPT-4.5 „Orion“ als Forschungsvorschau vorgestellt.

Neue Forschung: LLMs schlussfolgern ähnlich wie Menschen

Linux-Magazin

Von: Jens-Christoph Brendel

19. Februar 2025 um 09:35

Eine neue Studie zeigt, dass LLMs Daten auf der Grundlage ihrer Bedeutung als verschiedene Typen darstellen und über sie in ihrer dominanten Sprache denken.

xAI, die Firma von Elon Musk, releast ihr Flagschiff-Model Grok 3

Linux-Magazin

Von: Jens-Christoph Brendel

18. Februar 2025 um 08:46

Die KI-Firma von Elon Musk, xAI, hat ihr neues Sprachmodell Grok 3 veröffentlicht und kündigt neue Features für die Web- und iOS-Apps von Grok an.

Europa schickt eigenes LLM ins Rennen

Linux-Magazin

Von: Jens-Christoph Brendel

05. Februar 2025 um 12:05

Europas führende KI-Unternehmen und Forschungseinrichtungen bündeln ihre Kräfte und ihr Fachwissen, um im Rahmen des Projekts OpenEuroLLM Open-Source-Sprachmodelle der nächsten Generation zu…

Neuer Benchmark lässt alle LLMs alt aussehen

Linux-Magazin

Von: Jens-Christoph Brendel

04. Februar 2025 um 11:06

Ein kürzlich veröffentlichter neuer Benchmark unter dem Titel "Humanity's Last Exam" lässt alle heutigen Sprachmodelle verzweifeln.

Neue KI-Herausforderung aus China: Qwen-2.5 Max

Linux-Magazin

Von: Jens-Christoph Brendel

29. Januar 2025 um 09:53

Mit Alibaba hat ein weiterer chinesischer Hersteller ein großes Sprachmodell vorgestellt, das mit allen führenden Modellen (einschließlich DeepSeek) auf Augenhöhe operiert oder sie in Benchmarks…

Meta gibt Llama 3.3 frei

Linux-Magazin

Von: Jens-Christoph Brendel

09. Dezember 2024 um 17:14

Metas Vice President of generative AI, Ahmad Al-Dahle, hat auf X die Verfügbarkeit des neuen Sprachmodells Llama 3.3 bekanntgegeben.

Meta Llama 3.1 405B soll Maßstäbe setzen

Linux-Magazin

Von: Ulrich Bantle

24. Juli 2024 um 07:51

Meta will mit dem freien Large Language Model Meta Llama 3.1 405B eine neue Ära einläuten, in der Open Source den Weg vorgibt und nicht länger in Bezug auf Leistung und Fähigkeiten hinter den…

Llamafile 0.8.2 beschleunigt Auswertung von KI-Modellen

Linux-Magazin

Von: Tim Schürmann

13. Mai 2024 um 07:08

Die Software Llamafile erleichtert die Ausführung von quelloffenen Large-Language-Modellen (LLM), wie man sie etwa von ChatGPT kennt.

Lese-Ansicht