Chatbots enttäuschen, aber Sprach-KIs boomen

Noch vor wenigen Jahren war das Thema Chatbots mit Künstlicher Intelligenz in aller Munde. Das Versprechen: Als Nutzer spreche ich einfach mit der KI, wie mit einem Menschen, und sie löst das Problem für mich. Mittlerweile ist es ruhiger geworden um die Technologie – vor allem, weil die hohen Erwartungen enttäuscht wurden. Viel Arbeit ist notwendig, um die KIs mit Wissen zu füttern, und dennoch fragen Nutzer häufig ins Leere.

An anderer Stelle allerdings begeistern ähnliche Systeme und schaffen echten Mehrwert. Welche Anwendungsfälle funktionieren und wo sind die Grenzen?

Chatbots überzeugen nicht auf ganzer Linie

Chatbot-Systeme sind an verschiedenen Stellen nützlich: die Möglichkeit Fragen zu komplexen Sachverhalten zu stellen, das Potential einfach Workflows mit Rückfragen zu automatisieren oder einfacher Kundendienst im 24/7-Betrieb.

Leider bleibt es aufwendig diese Systeme mit Wissen zu füllen. Fragestellungen – so genannte „Intents“ – werden meist einzeln modelliert. Das liegt am fehlenden Allgemeinwissen unserer Chatbots. Die Sprach-KI kann zwar aus vielen verschiedenen Sätzen herausarbeiten, welchen Intent die Nutzer haben, aber was die Frage wirklich bedeutet, bleibt verborgen.

Ein für viele Tutorials genutztes Beispiel ist der Chatbot zum Bestellen einer Pizza. Diesem muss man nicht nur beibringen, dass „Bestellungen angenommen“ werden sollen, sondern auch, dass es verschiedene Böden gibt, eine Soße obendrauf kommt, und dann verschiedene Beläge.

Die Intelligenz, welche wir hinter einer künstlichen Intelligenz vermuten, ist also eher eindimensional. Sie versteht Sprache, aber nicht was gesagt wird.

Sprach-KIs punkten bei Zusammenfassungen und Textgenerierung

Die gleiche Art von Sprach-KI, welche dem Chatbot die Möglichkeit gibt, sowohl „Ich will eine Pizza bestellen“ als auch „Kann ich bitte eine Pizza bestellen“ in denselben Intent umzuwandeln, haben noch weitere Fähigkeiten.

Mit der Zusammenfassung langer Texte kann KI uns helfen einen Überblick über Dokumente zu erlangen oder die wichtigsten Sachverhalte aus langen Abhandlungen zu extrahieren. Derzeit funktioniert das besonders gut bei englischsprachigen Texten, allerdings noch deutlich schlechter mit deutschen.

Beim Generieren von Texten bekommt die KI einen kleinen Text vorgelegt und erstellt auf dieser Basis den Rest eines Satzes oder Absatzes. Die Systeme können aber auch einen Satz paraphrasieren oder Autoren beim Schreiben helfen.

In diesem Fall nutzen Menschen die Fähigkeiten der KI kreativ. Die Erwartungshaltung reduziert sich auf das, was große Sprachmodelle wirklich gut können: Sprache „verstehen“ und statistisch relevante Kombinationen von Wörtern kreieren.

Besteht also keine Hoffnung auf spannende Konversationen mit KI?

Neue Entwicklungen überraschen mit Flexibilität und Eloquenz

Vor kurzem machte die Geschichte von LaMDA die Runde – eine KI aus der Entwicklungsabteilung von Google, welche so clevere Antworten gibt und Rückfragen stellt, dass ein Mitarbeiter überzeugt war, es mit einer KI mit eigenem Bewusstsein zu tun zu haben. Die Konversationen, die LaMDA generiert, sind so eloquent und realistisch, dass man mindestens beeindruckt sein kann.

Weiterhin hat Googles Deepmind vor kurzem „Gato“ vorgestellt. Das KI-Modell, welches ähnlich wie die großen Sprachmodelle trainiert wurde, zeigt sich als äußerst vielseitig. Es kann Aufgaben aus der Sprach-Theorie lösen, etwa Fragen mit Fakten beantworten. Das gleiche Modell kann aber auch Computerspiele lösen oder Bildunterschriften generieren.

Auch wenn die Leistungsfähigkeit bei einzelnen Aufgaben noch nicht dem aktuellen Stand der Technik entspricht, ist die Entwicklung doch erstaunlich. Und sie öffnet den Weg zu noch leistungsfähigeren KIs, die weniger Training benötigen, um eine Aufgabe zu meistern. Sie bringen in gewisser Weise endlich das Allgemeinwissen mit.

Die Kombination aus diesen beiden Entwicklungen lädt zu Spekulationen ein: Vielleicht ist es doch bald nicht mehr unwahrscheinlich, dass wir einfach bei einem Chatbot eine Pizza Margherita bestellen können und der Bot versteht, was wir damit meinen. Können wir im nächsten Schritt einer KI in normaler Sprache erklären, was wir brauchen und sie wird per Roboter-Arm das Richtige tun? Das mag noch Zukunftsmusik sein, doch mit den aktuellen Entwicklungen befinden wir uns zumindest auf dem Weg dorthin.