KI-Sprachassistent für Bürgerdienste

01. März 2019 bis 31. Dez. 2019

Seit März 2019 arbeiten Fraunhofer FOKUS und das Fraunhofer IDMT gemeinsam an dem Projekt »Sprachassistent für Bürgerdienste« (Speech Assistance for Citizen Services, S4CS). Ziel ist es, einen KI-Demonstrator zu entwickeln, der den Bürger bei der Beantragung von Verwaltungsdienstleistungen durch einfache und intelligente Kommunikation in natürlicher Sprache unterstützt. Ein Szenario ist hierbei die Beantragung von Elterngeld über einen Sprachassistenten.

Auf Grund des Digitalisierungsprogramms der Bundesregierung (Onlinezugangsgesetz / OZG) hat dieses Thema eine hohe praktische Relevanz. Bislang besteht ein solcher Zugangskanal zur Verwaltung nicht. Mit der zunehmenden Nutzung intelligenter Sprachassistenten im Smart-Home-Bereich und im Mobilgerätesektor wird der Bürger dies aber zukünftig erwarten. Auch für die Barrierefreiheit ist die Möglichkeit, mit Bürgerdiensten natürlichsprachlich zu interagieren, ein großes Plus.

Um dieses Ziel zu erreichen wird die von Fraunhofer IDMT entwickelte Spracherkennungskomponente (speech-to-text) im Projekt mit der von Fraunhofer FOKUS entwickelten inferenzbasierten Methodik zur intelligenten Dialogkommunikation kombiniert. Im Vorhaben werden mehrere KI-komponenten und -ansätze genutzt:

  • Die von Fraunhofer IDMT entwickelte lokale, stabile, störgeräuschunempfindliche, hoch performante und skalierbare Sprachanalyse (speech-to-text) basiert auf tiefen neuronalen Netzwerken (engl. deep neural networks, DNNs).
  • Für die semantische Verarbeitung der Bürgeranfragen, also ihr inhaltliches Verstehen und Beantworten, wird die von Fraunhofer FOKUS entwickelte Constraint Handling Rules-Engine GoCHR eingesetzt. Die deklarative Sprache CHR ist der de-facto-Standard für Constraint-basierte Algorithmen und Anwendungen, die 1991 von Thom Frühwirth eingeführt wurde und sich schon in vielen Projekten bewährt hat. Die Spezifikation der Verarbeitungslogik erfolgt in verständlichen Constraint-Regeln, die schnell und flexibel für neue Verwaltungsdienstleistungen anpassbar sind.
  • Auch zur Spracherzeugung (text-to-speech) ist der Einsatz von Machine-Learning-Verfahren avisiert, um das als Übergangslösung verwendete, eine Kollektion eingesprochener Antwort-Clips kombinierende Verfahren abzulösen.

Das Projekt wird vom Fraunhofer-Forschungscluster Cognitive Internet Technologies (CIT) innerhalb des Forschungszentrums Maschinelles Lernen gefördert.