Simba: Intelligente Textvereinfachung für ein inklusiveres Internet
Berliner Forschungsinstitut präsentiert neue, frei verfügbare KI-Anwendung zur Reduzierung von Sprachbarrieren bei Online-Texten
Berlin, 09.09.2024. Simba hat eine klare Mission: Das Internet für alle verständlicher machen. Die Webanwendung zur Vereinfachung deutschsprachiger Texte wurde von Freya Hewett, Forscherin am Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG), entwickelt. Simba bietet zwei KI-gestützte Lösungen: eine Internet-App zur Vereinfachung eigener Texte und eine Browser-Erweiterung, die automatisch Texte auf Webseiten zusammenfasst. Damit werden digitale Sprachbarrieren abgebaut, das Leseerlebnis verbessert und der Zugang zur deutschen Sprache erleichtert.
Vereinfachte Sprache für alle
Menschen nutzen täglich das Internet, um sich über aktuelle Themen zu informieren. Viele Texte auf Webseiten und in Online-Artikeln sind jedoch oft schwer verständlich. Oftmals liegt dies an komplexen Sätzen und Fachbegriffen. Laut Freya Hewett, Computerlinguistin am HIIG und Initiatorin von Simba, benachteiligt dies insbesondere Menschen mit Lernschwierigkeiten oder jene, die Deutsch als Fremdsprache lernen. „Unsere Recherchen zeigen, dass besonders Webseiten öffentlicher Verwaltungen sowie im Bildungs- und Wissenschaftssektor durch ihre komplizierte Sprache einen wesentlichen Teil der Bevölkerung von wichtigen Informationen ausschließen“, erklärt Hewett. „Vereinfachte Sprache kann dazu beitragen, diese Lücken zu schließen. Die Teilhabe an der Gesellschaft hängt davon ab, Informationen und Dienste im Internet nutzen zu können.“
Simba ist eine kostenlose Lösung, die gezielt auch Endnutzer*innen anspricht und ihnen ermöglicht, Texte im Alltag selbst zu vereinfachen. Seine KI-gestützten Anwendungen ersetzen lange Wörter durch kürzere Begriffe, die eine ähnliche oder gleiche Bedeutung haben. Sie verkürzen Sätze und fügen zusätzliche Informationen hinzu, um Zusammenhänge klarer zu machen. Bisher waren vergleichbare Lösungen zur automatisierten Vereinfachung von Sprache in Deutschland kostenpflichtig und wurden vorwiegend von Institutionen und Unternehmen genutzt. Für viele Menschen, die auf leicht verständliche Texte angewiesen sind, waren diese Angebote aufgrund von Bezahlschranken nicht zugänglich. Simba schließt diese Lücke, indem es allen die Möglichkeit gibt, Texte selbst zu vereinfachen. „Unser Ziel ist es, dass Simba ein alltägliches Werkzeug wird, das allen Menschen hilft, die Textvereinfachung in ihrem Alltag nutzen möchten“, betont Dr. Theresa Züger, Leiterin der Forschungsgruppe, in der die KI-Anwendung entstanden ist.
Gemeinwohlorientierte Künstliche Intelligenz und Transparenz
Das Team um Dr. Theresa Züger erforscht, welche Eigenschaften Künstliche Intelligenz für das Gemeinwohl der Gesellschaft haben sollte. Diese Erkenntnisse werden in praktischen Prototypen umgesetzt, von denen Simba als erster veröffentlicht wird. Weitere Informationen zu diesen Überlegungen finden sich auf der Website publicinterest.ai.
In diesem Zusammenhang ist ein Alleinstellungsmerkmal von Simba seine Gemeinwohlorientierung. Das heißt, die KI-Anwendung wird ohne kommerzielle Interessen (non-profit) betrieben und die Entwickler*innen sind für Rückfragen erreichbar. Der Quellcode und die zugrunde liegenden Modelle sind frei zugänglich, was eine transparente Zusammenarbeit ermöglicht. Freya Hewett betont: „Wir möchten mit einer Community aus Forscher*innen, Inklusionsfachleuten und Nutzer*innen zusammenarbeiten, um Simba kontinuierlich weiterzuentwickeln und zu verbessern. Die Zielgruppen, die wir ansprechen – wie etwa Menschen mit Lernschwierigkeiten oder Personen, die Deutsch nicht als Muttersprache sprechen – sind sehr heterogen. Unser Ziel ist es, das Sprachmodell durch kontinuierliches Feedback zu verbessern und so Vereinfachungen zu schaffen, die wirklich vielen Menschen nützen.“
Prof. Dr. Wolfgang Schulz, Forschungsdirektor des HIIG, fügt hinzu: „Wir sind überzeugt, dass KI-Anwendungen wie Simba, frei verfügbar sein sollten, um eine inklusivere und gerechtere digitale Zukunft zu fördern. Sie können einen wesentlichen Beitrag zum gleichberechtigten Zugang zu Wissen leisten.“
Die Technologie hinter Simba
Die beiden Anwendungen von Simba basieren auf einem sogenannten „Textgenerierungsmodell“. Diese Modelle, auch als Large Language Models oder Foundation Models bekannt, werden mit großen Mengen an Textdaten trainiert. Sie berechnen, welches Wort in einer Sequenz am wahrscheinlichsten als nächstes kommt. Beispiele für solche Modelle sind GPT-4, Mistral 7B und Llama. Für Simba wurde das Foundation-Modell Llama-3-8B-Instruct verwendet, das durch deutschsprachige Zeitungsartikel verfeinert wurde.
„Wie bei allen Textgenerierungsmodellen besteht auch bei Simba die Möglichkeit, dass automatisch generierte Zusammenfassungen fehlerhafte Informationen enthalten“, erläutert Freya Hewett. „Dennoch sind wir überzeugt, dass Simba eine wertvolle Unterstützung bietet.“ Hewett empfiehlt den Eingabe- und Ausgabetext der KI-Anwendung sorgfältig zu vergleichen, um sicherzustellen, dass die Fakten korrekt sind.”
Partner gesucht
Simba steht als Prototyp bis auf Weiteres kostenlos zur Verfügung, doch die laufenden Kosten für den Betrieb einer solchen KI-Anwendung sind erheblich. Um die kontinuierliche Verfügbarkeit und Weiterentwicklung von Simba sicherzustellen, sucht das HIIG nach weiteren Kooperationspartnern. Unternehmen und Organisationen sind eingeladen, sich zu engagieren und entweder das Hosting oder die Weiterentwicklung der KI-Anwendung zu unterstützen. Durch diese Partnerschaften soll die Mission von Simba vorangetrieben und die digitale Inklusion gefördert werden.
Die Beta-Version von Simba entstand im Rahmen der vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Forschungsgruppe „Public Interest AI“ am HIIG unter der Leitung von Dr. Theresa Züger entwickelt. Freya Hewett hat das Sprachmodell trainiert und wurde von Hadi Asghari und Christopher Richter bei der technischen Umsetzung unterstützt. Larissa Wunderlich hat die Benutzeroberfläche gestaltet und die Webseite erstellt.
Anleitung für Simba
Eine ausführliche Anleitung zur Nutzung der Internet-App und der Browser-Erweiterung finden Sie hier. Sie ist in vereinfachter Sprache verfasst.
Kontakte für Presse
Frederik Efferenn | Tel. +49 30 200 760 82 | presse@hiig.de
Das Alexander von Humboldt Institut für Internet und Gesellschaft
Das Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG) erforscht die Entwicklung des Internets aus einer gesellschaftlichen Perspektive, um die damit einhergehende Digitalisierung aller Lebensbereiche besser zu verstehen. Als erstes Forschungsinstitut in Deutschland mit einem Fokus auf Internet und Gesellschaft hat das HIIG ein Verständnis erarbeitet, das die Einbettung digitaler Innovationen in gesellschaftliche Prozesse betont. Basierend auf dieser transdisziplinären Expertise und als Teil des Global Network of Interdisciplinary Internet & Society Research Centers will das HIIG eine europäische Antwort auf den digitalen Strukturwandel entwickeln.
SIMBA: SIMPEL UND BARRIEREFREI
Unsere KI-Anwendungen helfen, deutsche Texte zu verstehen und in vereinfachter Sprache zusammenzufassen. Unser Ziel ist es, so vielen unterschiedlichen Menschen wie möglich den Zugang zu Online-Texten und Informationen zu ermöglichen.