Mozilla veröffentlicht Common Voice 26
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 26 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mozilla Common Voice 26
Der nun veröffentlichte Datensatz Common Voice Scripted Speech 26 beinhaltet für die deutsche Sprache 1.490 Stunden an Daten und ist 34,77 GB groß. In Summe waren 20.529 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 4 für spontane Sprache kommt für Deutsch auf 1,2 Stunden an Daten und ist 33,36 MB groß, beigetragen von 28 Personen.
Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für vier neue Sprachen bringt, 294 Sprachen mit insgesamt 42.893 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 72 auf 78 Sprachen gewachsen.
Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen
Der Beitrag Mozilla veröffentlicht Common Voice 26 erschien zuerst auf soeren-hentzschel.at.
