Beschreibung der KI-Technologie & KI-Methode/n/-Komponenten

Neuronale maschinelle Übersetzung („neural machine translation“, NMT) hat die Qualität der automatischen Übersetzung so dramatisch verbessert, dass man für viele Sprachpaare und Domänen keine Qualitätsunterschiede zur menschlichen Übersetzung feststellen kann. Doch wie funktioniert maschinelle Übersetzung überhaupt und wie konnte sie in den letzten Jahren so gut werden? Hier also ein kleiner Einblick in die Grundlagen der maschinellen Übersetzung. 

Noch bis 2016 wurde der Stand der Technik durch die sog. statistische maschinelle Übersetzung („statistical machine translation“, SMT) definiert. Das System wird mit Hilfe von entsprechenden Sprachdaten trainiert. Dies sind i.d.R. von Menschen erstellte zwei- oder mehrsprachige übersetzte Texte (sog. bi- oder multilinguale Corpora). Auf der Basis der statistischen Entscheidungstheorie und der vorhandenen Sprachdaten schätzt SMT die Übersetzungswahrscheinlichkeiten für bestimmte Worte und damit auch Sätze ein. Aus dieser Analyse werden anschließend ein Wörterbuch sowie Grammatikübertragungsregeln für das jeweilige Themengebiet abgeleitet. 

Die Grundlage für neuronale maschinelle Übersetzungen („neural machine translation“, NMT) bilden jedoch künstliche neuronale Netze. Ein neuronales Netz besteht aus Einheiten, die „Knoten“ (ähnlich wie menschliche Neuronen), und alle Einheiten sind miteinander verbunden. Jede Verbindung zwischen den Knoten ist eine Zahl, die als „Kante“ bezeichnet wird. Neuronen und Kantenverbindungen werden durch eine bestimmte Zahl dargestellt, die man „Gewicht“ nennt. Zusätzlich gibt es die so genannte Eingabe- und Ausgabeschicht, die die Kommunikationsschnittstelle zwischen Mensch und Netzwerk herstellen. Wie SMT werden auch diese mit Hilfe von Sprachdaten  trainiert. Im Gegensatz zu dem traditionellen phrasen-basierten SMT Systemen, die aus vielen Unterkomponenten bestehen, die separat abgestimmt werden, versucht NMT ein großes neuronales Netzwerk aufzubauen und zu trainieren, das einen Satz und den Kontext liest. Die Parameter dieses komplexen neuronalen Netzwerks werden erstellt und mit Hilfe der Sprachdaten kontinuierlich verfeinert. 

In der Praxis hängt die Qualität eines NMT Systems von den folgenden Faktoren ab: 

  • Vorhandensein einer große Menge Sprachdaten (Wörter, Satzabschnitte und bereits übersetzte Texte) in dem jeweiligen Themengebiet. 
  • Die hohe Qualität der Sprachdaten – je genauer die Übersetzungen in den Trainingsdaten sind, umso besser ist das Ergebnis. 
  • Ausreichende Leistung der Computer, die zum Erstellen der Modelle und in einigen Fällen auch zum Verarbeiten von Echtzeitübersetzungen verwendet wurden. 

Aktuell gibt es einige allgemeine neuronale Übersetzungssysteme, die sich bei Privatnutzern großer Beliebtheit erfreuen wie z.B. Google Translate, DeepL, Microsoft Translator oder Amazon Translate. Allerdings speichern diese sowohl die eingegebenen Texte also auch das Output, was für Unternehmen und den öffentlichen Dienst aus datenschutzrechtlicher Sicht höchst problematisch ist. Damit NMT auch für KMU einsetzbar und erschwinglich ist, stellt die Europäische Kommission nicht nur ein entsprechendes neuronales MÜ-Tool, das von KMU kostenfrei genutzt werden kann und die Daten auf Wunsch nicht speichert zur Verfügung sowie entsprechende Sprachdaten für unterschiedlichste Einsatzbereiche. 

Mögliche Anwendungsbereiche

Die betrieblichen Einsatzbereiche von NMT sind extrem vielfältig und beinhalten insbesondere Kundenmanagement, Service, Marketing und Vertrieb, aber auch Logistik, Produktion, Lieferkette, Beschaffung/Einkauf, Forschung und Entwicklung sowie Qualitätskontrolle / Qualitätssicherung. Praktisch ist jeder Einsatzbereich möglich, in dem in kleinem oder großem Rahmen multilingual kommuniziert und informiert und damit übersetzt werden muss. 

Ähnliches gilt auch für die Branchen, in denen NMT in unterschiedlichen Facetten erfolgreich eingesetzt wurde und wird wie Chemie (z.B. BASF), Einzelhandel (z.B. Holland & Barrett), Automobil (z.B. Volkswagen, Daimler), Engineering (SMS Group GmbH), Energie, Finanzen, Kreativ & Marketing, Maschinenbau (z.B. Maschinenfabrik Berthold Hermle AG, Göttfert Werkstoff-Prüfmaschinen GmbH), Öffentlicher Dienst (z.B. im Rahmen der deutschen EU Ratspräsidentschaft), Logistik (z.B. DHL), Bahn & Verkehr (z.B. Deutsche Bahn), E-Learning, Luftfahrt, IT & Telekom (z.B. O2, Telefonica), aber auch Medizin  und Pharmazie, Versicherungsdienstleistungen, Gastgewerbe und Tourismus. 

Nutzen und Voraussetzungen für KMU

Der wohl größte Nutzen für KMU sind die Kosten- und Zeitersparnis bei Übersetzungen und multilingualer Kommunikation. Voraussetzung ist hierbei, dass sich das Projekt für maschinelle Übersetzung mit Nachbearbeitung eignet, d.h. dass ein entsprechendes Übersetzungstool zur Verfügung steht, das mit entsprechenden Sprachdaten in der jeweiligen Anwendungsdomäne trainiert wurde. Die maschinelle Übersetzungssoftware liefert dann zuverlässige, sektorspezifische Inhalte zum Bruchteil der Kosten einer vom Fachübersetzer durchgeführten Übersetzung. Die Nachbearbeitung durch einen entsprechenden Post-Editor stellt dann sicher, dass die maschinelle Übersetzung die Qualität einer menschlichen Übersetzung erreicht. Mit der Rohfassung einer maschinellen Übersetzung lassen sich bis zu 40 % der Kosten gegenüber einer manuell durchgeführten Übersetzung einsparen. Wie bereits erwähnt können entsprechend trainierte MÜ-Tools große Textmengen in kürzester Zeit verarbeiten und gleichzeitig eine sehr hohe Qualität der gemachten Übersetzungen gewährleisten. 

Forscher:innen und Anbieter: Bei Fragen steht Ihnen der Fachbereich Sprachtechnologie und Multilingualität des DFKI jederzeit gerne zur Verfügung (mlt-sek@dfki.de, +49 681 85775 5292).