Die Verwendung von maschineller Übersetzung ist für die meisten Menschen in der Schweiz, die Deutsch, Italienisch oder Französisch sprechen, ein gängiges Hilfsmittel im Alltag. Erstmalig ist es nun auch möglich, solche maschinellen Übersetzungssysteme für rätoromanische Texte einzusetzen. Im Auftrag und in Zusammenarbeit mit dem rätoromanischen Medienhaus RTR hat TextShuttle ein System für automatisierte Textübersetzung für die vierte Landessprache entwickelt.
RTR und das Spin-off der Universität Zürich nutzen modernste Technologien und vorhandene Sprachressourcen für die Entwicklung der Übersetzungslösung und tragen somit aktiv zum Erhalt der Landessprache bei. Die beiden Unternehmen haben sich während einer ersten Testphase intensiv mit der Übersetzung des Rätoromanischen ins Deutsche befasst. Dabei wurden alle Idiome und Rumantsch Grischun als Ausgangssprache erkannt. Bei Rätoromanisch als Zielsprache wird in Rumantsch Grischun übersetzt. Das Resultat lässt sich sehen: Das System übersetzt ins Deutsche, Französische, Italienische, Englische und umgekehrt. Es ist durchaus denkbar, dass in Zukunft auch einzelne Idiome berücksichtigt werden können.
Für Nicolas Pernet, RTR-Direktor, ist klar: «Wir wollen unserem Publikum einen Mehrwert bieten. Durch diese Technologie können wir unsere Sendungen vermehrt untertiteln und diese auf unterschiedlichen Plattformen (wie z. B. Play Suisse ) einem breiteren Publikum zur Verfügung stellen. Ausserdem ermöglicht uns diese Softwarelösung, Inhalte aus den anderen drei Landessprachen (z. B. von Nachrichtenagenturen oder Beiträge von unseren SRG SSR-Kolleg:innen) einfacher und schneller zu übersetzen. Gleichzeitig arbeiten wir daran, diese Technologie in einem weiteren Schritt auch der breiten Öffentlichkeit zugänglich zu machen. Davon würden nicht nur Privatpersonen, sondern auch eine Vielzahl von Gemeinden, Institutionen und Privatunternehmen profitieren.»
Automatisierte Übersetzung – so wird's gemacht
Die Übersetzung wird mittels neuronalen Netzen (künstliche Intelligenz) erstellt. Das Sprachmodell erlernt während eines mehrwöchigen Trainings auf Basis von vorhandenen Daten die Übersetzungsmechanismen, indem dem Modell immer wieder bestehende Übersetzungen gezeigt werden. Die Entwicklung wird in iterativen Prozessen vorangetrieben, die laufend durch aktuelle Technologien angepasst und ausgebessert werden. Benutzer und Benutzerinnen unterstützen diesen Prozess, indem sie die Ergebnisse evaluieren und Rückmeldungen zur Verbesserung geben.
Die Herausforderung besteht darin, dass das Rätoromanisch, im Vergleich zu weiter verbreiteten Sprachen, über sehr wenig bestehende Sprachressourcen verfügt. In der Entwicklung werden vorhandene Daten aufbereitet, parallelisiert und gesäubert, bevor sie für das Training berücksichtigt werden können. Bis jetzt wurden Segmente verwendet, die aus bestehenden, frei verfügbaren Korpora wie beispielsweise dem «Pledari Grond» stammen. Des Weiteren werden bestehende Daten von RTR in die Trainings eingebracht und priorisiert – dadurch ist das System auf die Texte von RTR spezialisiert.
Automatisierte Übersetzung – so funktioniert's
Die ersten Ergebnisse sind vielversprechend und wurden von Sprachexperten und Sprachexpertinnen als Unterstützung im Praxisalltag eingesetzt. Die automatisierte Übersetzung kann bequem für einzelne Wörter, ganze Texte oder Word-Dokumente in der Weboberfläche, dem sogenannten Translation UI, genutzt werden und funktioniert ähnlich wie frei verfügbare Übersetzungsdienste im Web. RTR wird die maschinelle Übersetzung künftig einsetzen, um die redaktionelle Arbeit zu erleichtern. Texte müssen anschliessend, wie bei jeder automatischen Übersetzung, lediglich leicht nachbearbeitet oder korrigiert werden. Dadurch wird die Untertitelung von einzelnen Sendungen einfacher und RTR kann beispielsweise auch mehr Content auf der nationalen Plattform «Play Suisse» anbieten.
Es ist denkbar, dass der Rätoromanisch-Übersetzer in Zukunft als Online-Dienst angeboten wird, um so der gesamten Bevölkerung den Zugang zur rätoromanischen Sprache zu ermöglichen. RTR hat vergangenes Jahr bereits mit der Firma Recapp die schriftliche Wiedergabe von gesprochenem Rätoromanisch lanciert und verfügt unterdessen über eine Spracherkennung (voice recognition) aller Idiome.