´Ka-min : KI

Spracherkennung- und Sprachverarbeitung

Durch den Einsatz von hochentwickelten Systemen von weltweit führenden Anbietern, bin ich in der Lage natürlichsprachliche Dialoge zu führen und auch zu verstehen.

Mit Hilfe von Spracherkennnungstechnologien (Speech to Text) wandle ich das gesprochene Wort in Text um. Nach der Verarbeitung mit Hilfe von Künstlicher Intelligenz gebe ich eine synthetisierte Audio-Ausgabe (Text to Speech) zurück zum Anrufer.

Da ich mich an der natürlichen Sprache des Menschen orientiere, ist es mir auch möglich Zusammenhänge (Kontext) zu verstehen und auch komplexe Zusammenhänge zu erkennen.

Deshalb kann ich z.B. auch aus offen gestellten Fragen wie “Möchten Sie einen Termin buchen oder was kann ich sonst für Sie tun ?” die Absicht des Kunden erkennen und die entsprechenden Inhalte daraus extrahieren.

Ich wurde so programmiert, dass ich mehr als 170 verschiedene Absichten von Kunden erkenne, sei es mittels Spracherkennung oder auch per Texteingabe

Da ich regelmäßig trainiert werde, lerne ich auch bei zunächst mir unbekannten Äußerungen des Kunden hinzu.

Dialogbeispiele

Selbstverständlich ist es für mich kein Problem die Absicht des Kunden bei “einfachen” Anfragen zu erkennen, z.B

  • Ich möchte einen Termin am 2. Juli um 9 Uhr
  • Wie sind die Arbeitszeiten am kommenden Montag ?
  • Ich habe eine Frage zur letzten Rechnung

Im ersten Fall schaue ich im Buchungskalender nach ob ein Termin zu diesem Zeitpunkt frei ist. Ich zweiten Fall gebe ich einfach die entsprechende Arbeitszeit für Montag zurück, und bei der Frage zur Rechnung verbinde ich den Kunden automatisch mit dem Chef.

______________________________

 

Allerdings kann ich auch mit komplexeren Äußerungen umgehen bei denen ich Rückbezüge auf vorher Gesagtes vornehmen muss (Kontext).

  • Ich habe am Montag Urlaub, kann ich da einen Termin bekommen ?
  • Ich möchte einen Termin am Freitag. Wann gibt es dort noch freie Termine ?
  • Ich habe gestern einen Zettel an der Haustür gehabt. Aber da geht es bei mir nicht
  • Wie sind die Arbeitszeiten am Montag ? (Antwort…) Würde es dort auch um halb 4 Mittags gehen ?
  • Ich habe einen Termin am Mittwoch um 12 Uhr. Kann ich den verschieben ?

Anhand von Pronomen (er, sie, es, oder der, die, das, dort, den usw.) beziehen wir uns häufig auf etwas Vorangegangenes. Auf was genau, wird meist nur aus dem Zusammenhang klar.

Ich erkenne zum Beispiel auch an welcher Stelle des Gesprächs ich mich gerade mit dem Kunden befinde wenn dieser sagt “Ich möchte einen anderen Termin”
Bei einer isolierten Äußerung gehe ich davon aus, dass ein Termin bereits vorhanden ist, und das dieser umgebucht werden soll. Also frage ich zunächst nach der Adresse und suche dann nach dem Termin.
Befinde ich mich mit dem Kunden jedoch bereits inmitten eines Buchungsvorganges für einen neuen Termin und der Kunde überlegt es sich währenddessen anders, dann frage ich welche Details er denn ändern möchte.

Eigene Sprach- und Akustikmodelle

Erst durch den Einsatz von eigenen Sprach- und Akustikmodellen ist es mir möglich Adressen treffsicher zu erkennen. Die Telefonie stellt hierbei sehr viel höhere Anforderungen als Text-basierte Systeme.  Je nachdem wie deutlich der Anrufer spricht oder wie er bestimmte Wortgruppen betont und ausspricht kann es unter Umständen schwierig sein, das auch wirklich Gemeinte herauszufiltern. Auch müssen Telefonbedingte Latenzen berücksichtigt werden (Qualität der Übertragungsleitung usw.)

Was ist gemeint ?

Breslauer Weg oder Prenzlauer Weg

Angeläcker oder Anne lecker

Knittswiesen oder Knipwiese

Orffweg oder Auf Weg

Ganz speziell wird es wenn zwischen gleich oder ähnlich klingenden Eigennamen unterschieden werden soll

Lehrstraße oder Leerstraße 

Mohrstraße oder Moorstraße

Eichgasse oder Bleichgasse

Steigstraße oder Staigstraße

Bodelshausen oder Odelshausen

Dann kommt noch die unterschiedliche Punktuation und Aussprache mit hinzu

  • 1 2 4 vierfünf Hechingen
  • viervier drei zwei 2 Berlin
  • Alte Straße 34 2 in 4.5 1 drei, sieben Kassel
  • Liststraße Hausnummer 11 1, 1.2 3 55 Hechingen

Keine Sorge, ich kann mit all dem umgehen denn ich wurde darauf speziell trainiert. Und die Künstliche Intelligenz hilft mir dabei.

 

Die nachfolgenden Videos zeigen Mitschnitte  von Telefonanrufen und die Interaktion mit der Konsole.

Terminvereinbarung:

Termineintrag in den Kalender:

Terminverschiebung:

Termine innerhalb eines Zeitraumes: