1
2
3
4
5
6

Corinna – ein Chatbot der nahezu alle Fragen rund um das neuartige Coronavirus online beantworten kann. Das Kompetenzzentrum Usability hat hierzu ein Interview mit dem StartUp innFactory aus dem Landkreis Rosenheim geführt, das den Chatbot im Rahmen eines Hobbyprojekts kreiert hat. Wie die Idee zum Chatbot entstanden ist, welche Nutzerfragen Corinna häufig gestellt werden und wo die Grenzen eines solchen Chatbots liegen - das und noch viel mehr hat uns einer der Mitgründer, Tobias Jonas, im vorliegenden Interview erzählt.

 

Wer steckt hinter eurem Start-Up und was macht ihr?

innFactory ist ein junges Software Unternehmen aus Rosenheim. Wir sind drei Gründer und haben uns im Studium kennengelernt. Mittlerweile sind wir acht Leute, davon alle hauptsächlich Techies, also Entwickler. Unser Know-how basiert auf einer Vielzahl von Projekten und Produkten rund um die Software- und Appentwicklung. Wir sind beispielsweise über das Innovationsmanagement der Volksbank Rosenheim zu unserem gemeinschaftlichen Produkt „Laura AI“ gekommen und haben gemeinsam einen Chatbot für die Immobilienfinanzierung entwickelt, der den User interaktiv über das Internet unterstützt. Wir hatten schon zuvor einiges an Know-How im Bereich Chatbots, konnten dieses aber durch das Produkt „Laura AI“ nochmals deutlich vertiefen. Im Vergleich zu vielen anderen Start-Ups sind wir auch komplett eigenfinanziert. Deswegen haben wir ein zweites Standbein im Bereich Software Consulting aufgebaut. Da dreht sich alles rund um Cloud Computing, Künstliche Intelligenz, Internet of Things, mobile Apps und Webentwicklungen. Momentan sind wir alle im Home-Office, wobei es nicht ganz so schlimm ist, weil wir wichtige Tools wie etwa Videokonferenzsysteme schon früher im Einsatz hatten.

Wie ist dann die Idee zum Chatbot Corinna entstanden?

Corinna ist vor allem dadurch entstanden, dass wir alle schon im Home Office waren und man im persönlichen Umfeld mitbekommen hat, dass immer mehr Fragen zum Thema Coronavirus auftauchten. Viele Leute hatten unendlich viele Fragen und keiner hatte eine richtige Antwort parat. Keiner wusste so recht, an wen man sich wenden kann. Und so ist der Chatbot Corinna erst vorletzten Freitag entstanden. Corinna ist also keine zwei Wochen alt. Die erste Version hat nur die Inhalte der FAQ vom Robert-Koch Institut (RKI) abgedeckt. Wir mussten diese Fragen jedoch auch etwas umformulieren und vereinfachen, da die Fragen des RKI eher akademisch gestellt waren. Kein Mensch würde diese Fragen einem Chatbot stellen. Auch hätte der Chatbot diese Fragen nicht erkennen können. Bei der initialen Gestaltung des Chatbots haben wir uns zunächst auch keine großen Gedanken über „Conversational UX“ gemacht oder konkret über den Aufbau der Dialogstränge nachgedacht, weil wir möglichst schnell eine Lösung auf den Weg bringen wollten. Der Chatbot „Corinna“ enthält aber auch nur eine Ebene – die Frage-Antwort Ebene. Deswegen haben wir im Team an einem Freitagnachmittag erstmal gemeinsam darüber geredet und Samstagmittag habe ich bereits den Chatbot auf Facebook veröffentlicht. Dadurch, dass wir den Chatbot so früh veröffentlicht haben, haben wir auch einfach geschaut, was für Fragen die User stellen werden und wo wir die passenden Informationsquellen für die Antworten beziehen können. In der Entwicklung haben wir daher einen datengetriebenen Ansatz gewählt.

Wie funktioniert der Chatbot Corinna?

Wir haben den Chatbot Corinna mithilfe der Plattform Dialogflow gebaut und trainiert. Dazu haben wir am Anfang versucht die Fragestellungen aus dem FAQ des RKI umzuformulieren und entsprechende Antworten hinterlegt. Nach und nach haben wir dem Chatbot immer neue Fragestellungen und Antworten beigebracht. Zunächst haben wir den Chatbot Corinna auf Facebook veröffentlicht. Mittlerweile gibt es den Chatbot aber auch als kostenlosen iframe, den bereits einige Institutionen, Kliniken oder auch Politiker auf ihrer Website eingebunden haben.

Wo findet Corinna derzeit überwiegend Anwendung?

Hauptsächlich auf Facebook, weil dort auch noch zusätzlich eine Art Newsticker integriert ist. Wir durchsuchen dabei mit einen News Crawler die größeren Online Medien wie etwa N-tv, Süddeutsche Zeitung oder ZDF nach neuen Nachrichten zu Corona, damit wir immer auf die neuesten Informationen zurückgreifen können. Die Kliniken Südostbayern haben Corinna zudem sowohl in ihrem Mitarbeiterportal als auch auf ihrer Website eingebunden. Auch die OVB Heimatzeitung und die Stadt Rosenheim haben unseren Chatbot integriert. Und auch diverse kleinere Arztpraxen in der Region, die derzeit massiv Probleme mit der Überlastung ihrer Telefone haben. Unser Chatbot findet daher durchaus Anklang. Ich denke, dass gerade bei den einfacheren Fragen Corinna schon behilflich sein kann. Auch vor dem Hintergrund, dass wir für die Entwicklung des Chatbots nicht viel Zeit hineingesteckt haben. Viele Leute wollen einfach nur wissen, wie die derzeitige Corona Lage in ihrem Landkreis ist. Das ist die momentan am häufigsten gestellte Frage. Und dafür muss dann auch keine Person vom Landratsamt kontaktiert werden. Das sind Angelegenheiten, die ein Chatbot durchaus sehr gut erledigen kann.

Welche weiteren Fragen werden noch häufig von den Nutzern an Corinna gestellt?

Häufig vorkommende Fragen sind beispielsweise: „Ich habe Symptom XY, habe ich Corona? „Was sind die Symptome von Corona?“, „Wie kann ich mich testen lassen?“, „Muss ich arbeiten gehen?“ oder „Hat XY noch offen oder ist XY noch erlaubt?“.

Neben den Quellen vom Robert-Koch Institut nutzt ihr, wie zuvor bereits angedeutet, noch weitere Informationsquellen. Wie stellt ihr sicher, dass diese nicht der Kategorie „Fake News“ angehören könnten?

Der Chatbot gibt grundsätzlich keine Gesundheitsempfehlungen ab. Wenn ich beispielsweise den Chatbot fragen würde, -  „Habe ich Corona?“-, dann wird man automatisch auf die Webapp der Charité Berlin verwiesen. In allen gesundheitskritischen Fragen haben wir daher regierungsnahe Quellen genommen. Beispielsweise bezieht sich der Chatbot bei manchen Fragen auf die Informationsquellen der John-Hopkins Universität, des RKIs und der WHO. Bei allgemeineren Fragen haben wir solche Newsquellen benutzt, die sich vor allem bei öffentlichen Pressestatements wiederfinden. Auch versucht man selbst mitzudenken und die Quellen, die in den Chatbot eingespeist werden, entsprechend zu verifizieren bzw. falsifizieren. Zudem wurden dem Chatbot bereits manche Fragen zu Fake News gestellt, wie beispielsweise die Warnung vor Ibuprofen mit der Uniklinik Wien als inoffizieller Quelle. Den wahrheitsgerechten Inhalt haben wir Corinna dann entsprechend antrainiert.

Was passiert technisch im Hintergrund eines Chatbots?

Wir haben uns beim Chatbot Corinna für „Dialogflow“ entschieden. Das ist sozusagen die Chatbot Engine der Google Cloud. Dialogflow wird zum Beispiel auch von Google Home und Android Smartphones für die Sprachverarbeitung verwendet. Hinter Dialogflow steckt ein NLP, also ein Natural Language Processing Algorithmus, der Methoden verwendet, um im Deep Learning Modus die jeweiligen Intents bzw. Entitäten zu erkennen. Wir haben daher nicht auf der Frameworkebene mit TensorFlow irgendetwas trainieren müssen, da die Technologie von Dialogflow bereits relativ gut ist. Die Erfahrung von Alexa, Siri und Google sollte man einfach nutzen. Gerade vor dem Hintergrund, dass der Chatbot auf Facebook veröffentlicht und immer online ist, stellt das jetzt auch kein großartiges Problem dar. Wenn man aber einen Sprachbot für das Auto entwickeln möchte, ist das natürlich eine andere Angelegenheit.

Wie lange dauert die Entwicklung eines Chatbots, bis dieser perfekt ausgebildet ist?

Wirklich perfekt ist ein Chatbot nie. Man kann sich zunächst Gedanken über die grundsätzliche Konversationsstruktur des Chatbots machen und dann auf weitere Rückfragen der Nutzer reagieren. Wir haben die erste Version von Corinna bereits nach 24 Stunden entwickelt und dann geschaut, was die Leute überwiegend fragen werden. Zudem arbeitet unser Chatbot nach dem Frage-Antwort-Muster und folglich nur auf einer Ebene. Das wäre zum Beispiel anders bei einem Chatbot für den Bewerbungsprozess, der tiefergehend arbeiten müsste. Unser Chatbot ist jetzt nicht wirklich perfekt, aber super funktional. Wir gehen so vor, dass wir einfach schauen, was die Nutzer wissen wollen und bei welchen Fragen der Chatbot bisher kein Match erzielt hat. Logischerweise waren die Nutzer am Anfang etwas unzufriedener, weil Corinna viele Fragen zunächst nicht beantworten konnte. Mittlerweile hat aber auch Corinna dazugelernt: Die Quote der Standardfragen zu den Fragen, die sie nicht beantworten kann, ist mittlerweile sehr hoch. Manche Nutzer verstehen schon gar nicht mehr, dass sie de facto mit einem Chatbot schreiben und schicken dann einfach einen Smiley an Corinna zurück. Oder fügen noch ein „Danke“ oder „Bitte“ mit dazu. Manche Fragen wird Corinna aber nie beantworten können. Zum Beispiel, wenn ein Nutzer in Briefform schreibt, in der die jeweilige Situation im ersten Absatz geschildert wird. Und erst im zweiten Abschnitt die dazugehörige Frage gestellt wird, was man in dieser jeweiligen Situation am besten tun sollte. Das sind leider Sachen, die sind bis zum jetzigen Zeitpunkt technisch leider noch nicht ausgereift.

Wie kann durch die Anwendung von Chatbots ein positives Nutzererlebnis sichergestellt werden?

Ich glaube, es muss zunächst ganz klar kommuniziert werden, was der Chatbot machen kann und wofür er da ist. Hier sollten vorab eindeutig die Grenzen definiert werden. In unserem Fall wäre das dann ein Chatbot, der sich nur den Themen rund um Corona widmet. Auch sollte der Chatbot immer eine zufriedenstellende Antwort liefern. Eine nicht-beantwortete Frage wäre für den User noch im Rahmen, bei einer zweiten nicht-beantworteten Frage ist der User aber dann sofort raus. Je breiter das Thema ist und je mehr Fragen ein User stellen kann, also wie höher der Freiheitsgrad letztendlich ist, umso wahrscheinlicher ist der User dann auch im Endeffekt gefrustet. Das ist dann ein schmaler Grat, in dem man entscheiden muss, ob der Chatbot das alles abdecken kann.

 

 

Das Chatbot Konfigurations Tool vom Karlsruher Institut für Technologie verweist auf diverse Charakteristika der Nutzer wie etwa Alter, Geschlecht oder Ausbildung, die in der Konfiguration des Chatbots mit einbezogen werden könnten. Haben solche potentielle Einflussfaktoren in der Mensch-Chatbot Interaktion auch Anwendung bei den von euch entwickelten Chatbots finden können?

Bis dato haben wir solche Faktoren noch nicht berücksichtigt. Aber das ist durchaus ein interessanter Punkt, vor allem bei Fragen des Gesundheitszustands. Bei Fragen wie, „Bin ich in einer Risikogruppe?“ wäre es sicherlich sehr interessant, vorab das Alter und das Geschlecht des Users zu wissen. Diese Angaben muss der Nutzer dann mit eingeben. Dadurch, dass unser Chatbot Corinna keine genauen Gesundheitsempfehlungen abgibt, berücksichtigen wir diese Nutzercharakteristika, Stand heute, noch nicht. Und das passt ganz gut so. Ich kann mir aber auch gut vorstellen, dass Chatbots generell viel besser funktionieren würden, wenn diese zukünftig auf demographische Hintergrunddaten der User zugreifen könnten.

Was sind die größten Hürden in der Entwicklung von Chatbots?

Einerseits kann man vorab nicht wissen, was die Nutzer genau fragen werden. Jeder der sich zuvor über die Konversationsstränge Gedanken gemacht hat, der wird sicherlich einen Punkt vergessen. Das habe auch ich bei den Chatbots gemerkt, die ich bereits trainiert habe. Dann taucht wieder eine Frage auf, wo ich mir denke, ja, das ist logisch, so hätte man die Frage auch stellen können. Aber zeitgleich ist die Frage immer noch zu weit weg, so dass der Chatbot diese nicht richtig erkannt hat. Hier ist die Frage dann grammatikalisch und damit auch statistisch zu weit weg. Bei Corinna ist es zudem problematisch, dass sich die News tagtäglich ändern. Damit ist auch der Sachverhalt jeden Tag ein anderer. Und es kostet enorm viel Zeit, den Chatbot immer wieder nach zu trainieren. Deswegen haben wir in den Chatbot auch den Stand der Informationsquelle datiert, für den Fall, dass wir doch etwas vergessen sollten und der Nutzer dann umgehend selbst am Datum erkennt, dass diese Informationsquelle nicht mehr ganz so aktuell ist. Das hat bei einen normalen Chatbot wahrscheinlich keinen so großen Einfluss, wenn er nicht auf Echtzeitdaten zurückgreifen soll. Da müsste man Corinna tendenziell weiterentwickeln, so dass der Chatbot dann auch in Echtzeit auf die Daten des RKIs zurückgreift und sich nicht einfach nur eine Kopie vorhält.

Welche wichtigen Tipps mit Blick auf die Entwicklung von Chatbots kannst du grundsätzlich geben?

Hier ist es meiner Meinung nach wichtig, den Chatbot auch sehr früh auszuprobieren. Es ist bei IT-Projekten generell angebracht, dass man bestimmte Projekte nicht zu Tode plant. Das man zum Beispiel keine Planungsphase von 5 Jahren hat, dann 3 Jahre umsetzt und nach 8 Jahren merkt, oh, da haben wir aber leider das Falsche gebaut. Sondern das Produkt bereits sehr früh ausprobiert. Der Chatbot ist auf jedem Fall ein MVP, sprich ein Minimal Viable Product, der einen gewissen Mindestnutzen hat und über die Daten gelernt hat, was als Nächstes getan werden soll. Ich glaube, man muss sich einfach ein Use Case raussuchen, bei dem man erwartet, dass er am häufigsten vorkommt. Und die zugrundeliegende Hypothese dann einfach verifizieren oder falsifizieren. So kann man über die Daten das weitere Vorgehen ableiten und damit auch, wie der Chatbot oder die Webanwendung weiterentwickelt werden soll.

Chatbots finden oft Anwendung im Dialogmarketing. Gibt es deiner Meinung nach auch Bereiche in denen Chatbots nur bedingt eingesetzt werden sollten? Und wenn ja, warum?

Viele Leute wissen einfach nicht, was für Fragen Sie einem Chatbot stellen können. Ein Chatbot möchte aber ganz klar wissen: was willst du von mir?. Ich glaube je komplexer dann das Thema ist, umso unwahrscheinlicher wird eine Anwendung. Bei den Sprachassistenten Alexa und Siri kann man bereits in der Nutzung beobachten, wie Kinder damit aufwachsen und nativ mit solchen Sprachassistenten umgehen können. Die Anwender im Alter zwischen 20 und 50 Jahren sind jedoch überwiegend die Google Suche mit einzelnen Schlagwörtern gewohnt. Für diese User ist eine komplette Konversation mit dem Computer eher ungewohnt. Und wenn das Themenfeld dann auch noch zu komplex sein sollte, dann ist die User Frustration sehr schnell erreicht. Hier sollte man eine höhere Nutzer Awareness schaffen, indem man verdeutlicht, dass ein Chatbot eben nur ein bestimmtes Themenfeld abdecken kann. Chatbots beinhalten nämlich keine grundallgemeine künstliche Intelligenz, die dir alle Fragen beantworten kann. Das wäre eher der Anspruch von Alexa und Siri. Deswegen muss man die Anwendung von Chatbots auch individuell betrachten und einfach ausprobieren.

Was waren deine besten und schlechtesten Erfahrungen mit Chatbots?

Die schlechteste Erfahrung war eine Chatbotanwendung im Einzelhandel, was aber auch etwas dem Gesamtprodukt geschuldet war. Die Leute wussten in diesem Fall nicht, welche Fragen sie dem Chatbot stellen könnten. Wir haben hierzu zwar auch Usability Tests im Einzelhandel durchgeführt, jedoch viel zu spät. Die Nutzer starrten dann lediglich den Bildschirm an und wussten nicht, was Sie jetzt genau tun sollen. Manche haben dann einfach nur „Nutella“ gesagt. Das war sehr frustrierend, auch weil wir hier viel Zeit investiert hatten. Damals wussten wir leider noch nicht, dass wir solche Chatbots auch tatsächlich früh ausprobieren und viel öfters testen müssen. Die beste Erfahrung haben wir tatsächlich mit Corinna gemacht. Diese findet derzeit enorm viel Anwendung. Corinna hat schon mehr als 100.000 Personen erreicht, mehr als 1.000 Likes auf Facebook und knapp 1.000 User haben schon mit ihr gechattet. Solch eine Reichweite innerhalb kürzester Zeit zu erreichen, ist schon enorm viel für einen Chatbot. Der Bekanntheitsgrad wird dabei sicherlich auch über die Newstimeline auf Facebook befördert. Viele Nutzer würden sonst nicht auf die Idee kommen, den Chatbot anzuschreiben. Das ist uns schon auch bewusst. Aber trotzdem ist das ein sehr positives Erlebnis. Vor allem, weil ich es von unserem anderen Produkt in der Baufinanzierung nicht kenne, dass die Nutzer dem Chatbot doch so viele Fragen stellen können.

Wie werden Usability und User Experience in die Entwicklung eurer Software eingebunden?

Bei uns in Rosenheim gibt es so genannte Usability-Testessen. Das machen wir eigentlich regelmäßig, normalerweise findet das einmal im Monat statt. Und alle Produkte und Projekte werden dort dann getestet. Dadurch, dass wir agil mit Sprints arbeiten, versuchen wir auch mit Sprints Tester einzuholen, mit denen wir dann unsere Produkte ausprobieren können. Bei unserem Produkt „Laura AI“ haben wir beispielsweise mit den Azubis der VR Bank Usability Tests ausprobiert. Hier ist es grundsätzlich wichtig, Produkte immer wieder auszuprobieren, zu testen, aber auch zu verwerfen, wenn diese nicht funktioniert haben.

Gibt es dann von Anfang an einen UUX-Experten im Team?

Theoretisch schon, bei Corinna war das jedoch nicht der Fall. Hier wurde aber auch von Anfang an kein allzu großer Wert auf die Qualität gelegt, sondern auf die Geschwindigkeit. Jetzt ist das Projekt zwei Wochen alt und normalerweise würde man sich über die UUX deutlich mehr Gedanken machen. Der Chatbot Corinna ist jetzt aber auch kein Projekt, welches wir im Verkauf anbieten würden. Das ist nicht unser Qualitätsanspruch. Grundsätzlich haben wir dann schon einen UUX-Experten im Team.

Wie ist die Resonanz auf Corinna bisher ausgefallen?

Sehr, sehr positiv. Einerseits kommt der Newsticker sehr gut an. Viele Nutzer informieren sich über die Timeline auf Facebook. Auch die Konversationsentwicklung ist sehr positiv, vor allem weil die User merken, dass wir den Chatbot tatsächlich nachtrainieren. So stellen viele Nutzer die gleiche Frage am nächsten Tag noch einmal und bemerken dann, dass Corinna ihre Frage nun doch beantworten kann. Zu manchen Subthemen, wie beispielsweise Gesundheitsthemen, funktioniert das leider nicht, auch weil wir nun mal keine Gesundheitsempfehlungen abgeben wollen. Bei juristischen Fragen verweisen wir ebenso auf andere Quellen. Aber wie gesagt, die Resonanz ist bis dato überwiegend positiv ausgefallen. Auch weil wir anfangs nur 100 Euro genommen haben, um eine gewisse Grundbekanntheit von Corinna zu erreichen. Eine Reichweite von 100.000 Leuten mit 100 Euro zu generieren, davon träumt eigentlich jeder im Marketing.

Und wie geht es mit Corinna nach der Corona-Krise weiter?   

Der News-Crawler wird mit Sicherheit irgendwann ausgeschaltet werden, weil dieser dann nicht mehr von Relevanz sein wird. Ich glaube, sobald die Leute wieder rausgehen können, wird der Informationsbedarf auch deutlich abnehmen. Der Chatbot „Corinna“ wird derweil aktiv bleiben. Das ursprüngliche Ziel war es ja, im Rahmen eines Hobbyprojekts den Use Case zu entwickeln und den Leuten zu helfen. Das haben wir erreicht. Wir lassen uns überraschen, wie es dann weitergehen wird.

Vielen Dank für das Interview.

 

Das Gespräch wurde mit Tobias Jonas, einem der Mitgründer von innFactory, am 25. März 2020 via Skype durchgeführt.


26.03.20

1
2
3
4
5
6
 
Das Mittelstand-Digital Netzwerk bietet mit den Mittelstand-Digital Zentren und der Initiative IT-Sicherheit in der Wirtschaft umfassende Unterstützung bei der Digitalisierung. Kleine und mittlere Unternehmen profitieren von konkreten Praxisbeispielen und passgenauen, anbieterneutralen Angeboten zur Qualifikation und IT-Sicherheit. Das Bundesministerium für Wirtschaft und Klimaschutz ermöglicht die kostenfreie Nutzung der Angebote von Mittelstand-Digital. Weitere Informationen finden Sie unter www.mittelstand-digital.de.