Normale Ansicht

Vorgestern empfangen

Mozilla Common Voice 23: 149 neue Sprachen und Spontane Sprache

24. November 2025 um 06:10

Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 23 seines Datensatzes veröffentlicht. Mit 149 neuen Sprachen werden jetzt mehr als doppelt so viele Sprachen unterstützt. Außerdem gibt es ab sofort zusätzliche Datensätze für spontane Sprache.

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.

149 zusätzliche Sprachen

Mozilla Common Voice war bereits der vielfältigste mehrsprachige Sprachkorpus der Welt. Der nun veröffentlichte Datensatz Common Voice 23 bringt sage und schreibe Unterstützung für 149 neue Sprachen. Damit wurde die Anzahl mehr als verdoppelt. Common Voice unterstützt jetzt 286 Sprachen.

Insgesamt bringt die neue Version 2.105 Stunden zusätzliche Sprachdaten, was zu einer neuen Gesamtzahl von 35.921 Stunden führt. Der deutschsprachige Datensatz ist von 1.476 Stunden auf 1.484 Stunden gewachsen. In Summe waren 20.355 Menschen am deutschsprachigen Datensatz beteiligt.

Spontane Sprache

Parallel zu den bestehenden Datensätzen für geschriebene Sprache, bei denen vordefinierte Sätze vorgelesen werden, baut Mozilla mittlerweile auch Datensätze für sogenannte spontane Sprache auf, um die Stimme auf natürlichere Weise einzubringen. Dabei werden Fragen in eigenen Worten beantwortet und anschließend transkribiert.

Common Voice 23 bringt die ersten Datensätze hierfür und beinhaltet 357 Stunden spontaner Sprache, verteilt auf 51 Sprachen. Speziell der deutschsprachige Datensatz beinhaltet 48 Clips mit einer Gesamtlänge von einer Stunde, beigetragen von zwei Personen.

Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen

Der Beitrag Mozilla Common Voice 23: 149 neue Sprachen und Spontane Sprache erschien zuerst auf soeren-hentzschel.at.

Mozilla startet Datenplattform Mozilla Data Collective

23. November 2025 um 12:59

Mit dem Mozilla Data Collective hat Mozilla eine Plattform gestartet, über welche Organisationen und Menschen Datensätze anderen zur Verfügung stellen können. Auch die Datensätze von Mozilla Common Voice stehen ab sofort exklusiv über Mozilla Data Collective zur Verfügung.

Mozilla Data Collective

Mozilla hat das Mozilla Data Collective gestartet. Dabei handelt es sich um eine Plattform, die es ermöglicht, Daten für andere verfügbar zu machen, das Eigentumsrecht daran zu behalten und zu kontrollieren, wer sie nutzt. So können entweder bestehende Lizenzen wie Creative Commons genutzt oder eine eigene Lizenz erstellt werden. Es können Daten für alle oder nur für bestimmte Arten von Downloadern freigegeben werden, benutzerdefinierte Einschränkungen festgelegt und ein Austausch, eine Vergütung oder eine Anerkennung verlangt werden. Personen, die auf die Datensätze zugreifen, werden authentifiziert und sind an rechtlich bindende Verträge gebunden. Mozilla verspricht darüber hinaus eine Reihe von Funktionen zum Schutz der Datensätze. Neben dem Download der Datensätze bietet Mozilla für Entwickler auch eine Schnittstelle sowie eine Python-Bibliothek zum Zugriff an.

Mozilla Data Collective

Um die Plattform zu finanzieren, möchte Mozilla ab dem ersten Quartal 2026 den Erstellern von Datensätzen die Möglichkeit anbieten, einen finanziellen Beitrag zur Nutzung von Datensätzen zu verlangen. Dann würde Mozilla fünf Prozent als Plattformgebühr einbehalten. Langfristig behält sich Mozilla außerdem vor, eine Gebühr von beispielsweise großen Unternehmen zu verlangen, welche die Plattform in großem Umfang nutzen.

Mozilla Common Voice

Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Common Voice stellt den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.

Downloads der Common Voice Datensätze stehen ab sofort über Mozilla Data Collective zur Verfügung und zeigen dort jetzt unter anderem auch demographische Informationen wie den Anteil verschiedener Altersgruppen und Geschlechtern der Beitragenden für den Datensatz jeder Sprache an.

Der Beitrag Mozilla startet Datenplattform Mozilla Data Collective erschien zuerst auf soeren-hentzschel.at.

Thunderbird 145 bringt moderne Technik, mehr Sicherheit und Microsoft Exchange Support

Von:MK
17. November 2025 um 07:00

Mozilla hat eine neue Version von Thunderbird veröffentlicht. Die beliebte Anwendung steht nun als Ausgabe 145 bereit und bringt einige wichtige Neuerungen für den täglichen Einsatz. Viele Änderungen betreffen die technische Basis, doch auch sichtbare Verbesserungen sind dabei. Eine zentrale Neuerung betrifft die Anbindung an Exchange Systeme. Thunderbird kann nun direkt mit Exchange Web Services […]

Der Beitrag Thunderbird 145 bringt moderne Technik, mehr Sicherheit und Microsoft Exchange Support erschien zuerst auf fosstopia.

Thunderbird bald mit Microsoft Exchange Support – Start im Oktober 2025

Von:MK
25. September 2025 um 06:00

Es liegt derzeit nicht nur etwas herbstliches in der Luft. Das Thunderbird Team hat bestätigt, dass die kommende Version 144 im Oktober 2025 erscheinen wird. Erstmals wird damit eine offizielle Unterstützung für Exchange Konten eingeführt. Dieser Schritt markiert einen wichtigen Wendepunkt für das bekannte E Mail Programm. Durch die neue Anbindung öffnet sich Thunderbird nun […]

Der Beitrag Thunderbird bald mit Microsoft Exchange Support – Start im Oktober 2025 erschien zuerst auf fosstopia.

Mozilla beendet Unterstützung für 32-Bit Firefox für Linux

Von:MK
12. September 2025 um 06:00

Mozilla hat angekündigt, im Oktober 2025 den Support für Firefox auf 32-Bit-Linux-Systemen einzustellen. Die kommende Version 144 wird die letzte sein, die offiziell auf dieser Architektur läuft. Die darauffolgende Version 145 wird somit keine 32-Bit-Pakete mehr anbieten. Über Jahre hinweg hatte Mozilla im Gegensatz zu vielen anderen Anbietern weiterhin 32-Bit-Builds gepflegt. Ziel war es, älteren […]

Der Beitrag Mozilla beendet Unterstützung für 32-Bit Firefox für Linux erschien zuerst auf fosstopia.

US-Gericht: Google darf weiter für Standardsuche zahlen. Mozilla atmet auf

Von:MK
03. September 2025 um 06:15

Ein US-Bundesgericht hat entschieden, dass Google weiterhin Zahlungen an andere Unternehmen leisten darf, um als Standardsuchmaschine festgelegt zu werden. Das betrifft insbesondere Browserhersteller wie Mozilla, deren Firefox Browser auf genau solche Einnahmen angewiesen ist. Die Entscheidung stammt von Richter Amit Mehta und folgt auf ein früheres Urteil, das Google ein illegales Monopol im Suchmarkt attestierte. […]

Der Beitrag US-Gericht: Google darf weiter für Standardsuche zahlen. Mozilla atmet auf erschien zuerst auf fosstopia.

❌