Zur Werkzeugleiste springen
raceagainstthemachine

Der KI Doppelgänger

In Zeiten von Corona finden Meetings online statt. Bei manchen ist es Microsoft Teams, bei anderen Skype oder eben Zoom (wenn auch wegen Sicherheitslücken in der Kritik aktuell). Seit dem diese Meetings so gut funktionieren, nehmen sie auch fast schon wieder überhand. Man kommt an manchen Tagen vor lauter Online-Meetings mittlerweile gar nicht mehr zum Arbeiten oder mal nach draußen. Da kam Matt Reed, Mitarbeiter der Marketing Design Firma redpepper, auf die Idee einen „Zoombot“, so etwas wie eine Art Chatbot nur für Online-Meetings mit Zoom, zu erstellen. Dieser „Zoombot“ sollte ihn selber auf dem Display der Kollegen zeigen und automatisiert auf Fragen antworten können. Dadurch erhoffte er sich eine Art KI-Vertreter in den Online-Meetings einsetzen zu können. Gedacht, getan. Hier ist das Ergebnis nach einem Vormittag Arbeit durch einen Nicht-KI-Programmierer: 

Wen das Ergebnis enttäuscht, das ist natürlich keine high-end KI-Anwendung, die durch ihre Echtheit verblüfft. Das kann und soll es auch gar nicht sein. Es ist ein Spaß von jemandem, der kein KI-Programmierer ist und er hat dafür nur einen Vormittag an Arbeit reingesteckt! Die Stimme ist eine Standard-Computerstimme und kann nur auf sehr wenig antworten. Die Kolleginnen und Kollegen sind aber sichtlich verdutzt und amüsiert. Und es lädt zum diskutieren über KI ein!

Wie wurde das Ganze erstellt? Es beginnt mit ein paar Aufnahmen von sich selbst mit verschiedenen Gesichtsausdrücken (lachend, erstaunt, verwirrt, staunend mit offenem Mund etc). Diese unterschiedlichen Gesichtsausdrücke wiederholen sich und es sieht so aus, als hätte er Verbindungsprobleme. Über eine einfache HTML Web-Applikation (mit Open Source Funktionalität), fügte er die Funktionen „zuhören“ und „antworten“ hinzu. Die über das Mikrofon ankommenden Audiosignale können also vom Programm „verstanden“ und beantwortet werden. Hierzu musste er aber bestimmte Phrasen manuell hinzufügen. So z.B., dass der „Zoombot” auch mit „Hallo“ oder „Hi“ antwortet, wenn jemand „Hallo“ sagt. Abschließend musste er noch das reale Videosignal mit einem virtuellen ersetzen, sodass der virtuelle Matt Reed gezeigt wird, statt dem tatsächlichen Bild. Und fertig war der „Zoombot“. Er stellte sein Projekt Open Source zur Verfügung und viele andere sind mittlerweile auf den Zug aufgesprungen und optimieren und verbessern den „Zoombot“.  

Was bedeutet das alles für das Arbeiten mit Künstlicher Intelligenz? Bei KI kommt es nicht darauf an, alles selber zu programmieren und herzustellen. In diesem Fall, hat Matt „nur“ die grundlegenden Daten über sich (Aussehen, Mimik etc.) selber hergestellt. Der Rest seines Programms ist ein Zusammenstellen verschiedener spezieller Bausteine, die entsprechende Funktionalitäten bereitstellen. Der KI-Baustein im gesamten Konstrukt ist die Sprachschnittstelle (text-to-speech), wenn ein Audiosignal wie „Hallo“ reinkommt und auf Basis dieses Inputs ein Output erzeugt wird. Er hat diese Schnittstelle nur mit wenigen Wörtern ausgestattet. Entsprechend wenig kann der „Zoombot“ auch antworten. Aber er brauchte dazu keinerlei KI Kenntnisse, um das tun zu können. Andere KI Anwendungen wie Chatbots arbeiten auch mit solchen Funktionsbausteinen, nur sind diese besser trainiert. Doch auch sie können nur auf das antworten, was ihnen antrainiert wurde. Und sie offenbaren viele Fehler, weil die Variabilität der menschlichen Sprache viel zu hoch ist, als dass man alles antrainieren könnte. Zumindest noch. Denn die KI wird diesbezüglich immer besser. 

Wie gut die KI per Sprache mittlerweile mit Menschen kommunizieren kann, wenn sie von Profis mit hohem Aufwand entwickelt wurde, zeige ich euch im nächsten Blog.  

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.