Mozilla veröffentlicht Common Voice 24
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 24 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mozilla Common Voice 24
Der nun veröffentlichte Datensatz Common Voice Scripted Speech 24 beinhaltet für die deutsche Sprache 1.483 Stunden an Daten und ist 34,53 GB groß. In Summe waren 20.413 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 2 für spontane Sprache kommt für Deutsch auf zwei Stunden an Daten und ist 21,96 MB groß, beigetragen von 17 Personen.
Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für drei neue Sprachen bringt, 289 Sprachen mit insgesamt 38.932 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 58 auf 62 Sprachen gewachsen.
Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen
Der Beitrag Mozilla veröffentlicht Common Voice 24 erschien zuerst auf soeren-hentzschel.at.