Common Voice ist ein Crowdsourcing-Projekt der Mozilla Foundation. Dieses entwickelt einen öffentlich verfügbaren Sprachdatensatz, der durch Stimmaufnahmen von Freiwilligen auf der ganzen Welt geschaffen wird. Seit 2019 können Menschen diesen als Grundlage für den Aufbau von möglichst diskriminierungsarmen Sprachanwendungen verwenden. Denn viele der bisher verwendeten Stimmdatensätze für KI-Systeme – wie zum Beispiel Übersetzungstools oder der Sprachassistent Alexa – bevorzugen die Stimmen weißer, englischsprachiger Männer. Das bedeutet, dass viele dieser Technologien in vielen Sprachen überhaupt nicht funktionieren. In den Sprachen, in denen sie funktionieren, klappt das dann oft nicht bei allen Menschen gleich gut.
Deswegen setzt sich Common Voice mit ihrem inklusiven Datensatz dafür ein, bisher nicht berücksichtigte und zukünftige Nutzer*innengruppen in viele ihrer Entscheidungsprozesse mit einzubeziehen. Dies ist, wie bereits unser Forschungsbericht für das Civic Coding Innovationsnetzwerk (2022) beleuchtete, eine notwendige Anforderung zur Entwicklung gemeinwohlorientierter KI. Doch wie genau ebnet Common Voice den Weg für gerechte und inklusive sprachgesteuerte Anwendungen durch gesellschaftliche Partizipation? Was können andere Projekte davon lernen? Diese und weitere Fragen werden in diesem Blogpost beleuchtet.