Mozillas Common Voice Corpus 18.0 ist da
Mozilla bietet mit Common Voice Corpus einen großen Datensatz mit menschlichen Stimmen an, mit dem sich Spracherkennungssoftware trainieren lässt.
Mozilla bietet mit Common Voice Corpus einen großen Datensatz mit menschlichen Stimmen an, mit dem sich Spracherkennungssoftware trainieren lässt.
Mozilla bietet mit Common Voice Corpus einen großen Datensatz mit menschlichen Stimmen an, mit dem sich Spracherkennungssoftware trainieren lässt. Mit Version 14 ist der freie Common Voice Corpus nochmal gewachsen.
Mozilla Common Voice ist eine Open-Source-Initiative, um den Zugang zu Sprachtechnologie allgemein zu erleichtern. Die Teilnehmer am Projekt spenden Sprachdaten für einen freien, öffentlichen Datensatz, der von jedermann genutzt werden kann, um sprachgesteuerte Technologien zu trainieren. Das Projekt versucht damit, einzelnen Entwicklern und kleinen Unternehmen einen Datensatz zu bieten, denen ein solcher Zugang wegen fehlender finanzieller Mittel sonst verwehrt wäre.
Der deutsche Datensatz ist mit Version 14 auf über 32 GByte angewachsen. Er umfasst 1376 Stunden Sprachdateien mit 18.187 verschiedenen Stimmen. Mozilla bietet inzwischen über das Common Voice Projekt auch sogenannte Delta-Segmente zum Download an. Diese enthalten dann nur die neu hinzugekommenen Daten im Vergleich zur Vorversion. Mozilla erläutert das Prozedere der Delta-Versionen hier ausführlich.
Der Beitrag Common Voice: Neuer Datensatz für Spracherkennung erschien zuerst auf Linux-Magazin.
Mozilla hat seinen Datensatz von Sprachmustern für das Training von Sprachtechnologien aktualisiert. Mit Common Voice Corpus 13.0 stehen noch einmal mehr Beispiele von Sprachdateien für Entwickler von Spracherkennungsanwendungen zur Verfügung.
Der zum Download angebotene deutsche Sprachdatensatz umfasst Sprachdateien im Umfang von 1340 Stunden. Er ist 31,5 GByte groß und liefert 17.867 Stimmen. Jeder Eintrag im Datensatz besteht aus einer eindeutigen MP3- und zugehörigen Textdatei. Viele der aufgezeichneten Stunden im Datensatz enthielten auch demografische Metadaten wie Alter, Geschlecht und Akzent, mit deren Hilfe die Genauigkeit von Spracherkennungs-Engines trainiert werden könne, teilt Mozilla mit.
Der komplette Datensatz bestehe derzeit aus 17.690 bestätigten Stunden in 108 Sprachen. Mozilla Common Voice ist eine Open-Source-Initiative, um den Zugang zu Sprachtechnologie allgemein zu erleichtern. Die Teilnehmer am Projekt spenden Sprachdaten für einen freien, öffentlichen Datensatz, der von jedermann genutzt werden kann, um sprachgesteuerte Technologien zu trainieren. Das Projekt versucht damit, einzelnen Entwicklern und kleinen Unternehmen einen Datensatz zu bieten, denen ein solcher Zugang wegen fehlender finanzieller Mittel sonst verwehrt wäre.v
Der Beitrag Mozilla veröffentlicht Common Voice Corpus 13.0 erschien zuerst auf Linux-Magazin.