AI und Telefonie
Was ist eigentlich AI und was sind Voice‑Agenten? Sogenannte AI-Agenten verbessern Ihre Telefonie und diese neue Technologie können Sie schnell und einfach bei Placetel einsetzen.
Was ist AI
AI oder Künstliche Intelligenz (KI) ist ein Computerprogramm, das lernt, Aufgaben zu erledigen, die normalerweise Menschen machen. Bei Sprache bedeutet das: AI kann zuhören, verstehen, antworten und sprechen.
Ein AI‑Programm sieht viele Beispiele (Texte, Gespräche) und findet Muster.
Aus den Mustern lernt es Regeln und kann dann ähnliche Texte oder Antworten erzeugen.
Es gibt große Anbieter, die AI Modelle bereitstellen wie Google Gemini, OpenAI ChatGPT oder Microsoft Copilot. Sie liefern die Kernintelligenz, die wir für Sprache und zum Verstehen nutzen.
Modelle werden mit riesigen Textmengen und Sprachaufnahmen trainiert.
Beim Training lernt das Modell, Wörter, Sätze und Zusammenhänge vorherzusagen.
Moderne Modelle imitieren menschliche Sprache sehr genau, weil sie mit echten Gesprächen und vielen Stimmen trainiert wurden.
Zusätzliche Technik (Stimmen‑Modelle) sorgt für natürliche Pausen, Atem und Sprechgeschwindigkeit.
Wie werden AI‑Modelle für deutschsprachige Unternehmen angepasst
Damit die AI Deutsch natürlich versteht und ausspricht, wird sie mit deutschen Texten, Dialekten und Aussprachevarianten trainiert.
Allerdings, da die AI-Modelle nur von großen Anbietern zur Verfügung gestellt werden, bringen sie nur ein allgemeines Sprachwissen mit. Deswegen, muss man sie begrenzen, damit sie nur bezüglich der jeweiligen Firma und dessen Dienstleistungen Fragen beantwortet, durch z.B. Dokumente oder CRM‑Einträge. Dafür füttert man die AI mit branchenspezifischen und unternehmensspezifischen Informationen.
So versteht die AI lokale Begriffe, Rechtslagen und typische Anfragen von Kunden.
Was sind AI‑Agenten (Voice‑Bots) und woraus bestehen sie
AI‑Agenten sind sprechende Programme, die Anrufe annehmen, verstehen und beantworten auf Basis von AI-Modellen. Diese bestehen aus:
- Spracherkennung (ASR): Wandelt das gesprochene Wort in Text um.
- Verständnis / Dialogmanager: Entscheidet, was die beste Antwort ist.
- Wissensbasis: Informationen, Regeln und Antworten, speziell für Ihre Branche.
- Text‑to‑Speech (TTS): Wandelt die Antwort in eine natürliche Stimme um. TTS fügt gezielt Pausen, Atemgeräusche und variable Geschwindigkeit hinzu für ein echtes Gesprächserlebnis. Sie können allerdings den Ton und Formalität frei konfigurieren.
Wie AI‑Agenten die Telefonanlage verbessern
Sobald der Anruf in die Telefonanlage trifft, wird das Audiosignal an die Spracherkennung geschickt. Der erkannte Text geht an den Dialogmanager, der eine Antwort plant. Die Antwort wird per TTS in Sprache umgewandelt und der Anrufer hört diese Antwort.
Somit spricht der Kunde anstatt mit starren Sprachmenüs (IVRs: Drücken Sie die „1“ um weitergeleitet zu werden) frei und natürlich mit dem AI-Agenten, der sein Anliegen erkennt. Der AI-Agent leitet dann den Anruf entsprechend weiter oder das Anliegen wird direkt von dem AI-Agenten gelöst.
Wie werden AI‑Agenten mit der Telefonanlage verknüpft
So einfach ist die Aktivierung bei Placetel: Sie wählen eine Telefonnummer, die wir bereitstellen und verknüpfen die mit Ihrem AI‑Agenten. Danach gehen Anrufe automatisch an den Agenten.
SIP / VoIP Verbindung: Die Telefonanlage leitet das Gespräch digital an die AI‑Plattform.
RTP/Audio Streaming: Echtzeit‑Audio wird zur Spracherkennung übertragen.
ASR → NLU → TTS: Audio wird zu Text, Text wird verstanden, Antwort wird in Sprache zurückgegeben.
Text‑Prompting und Kontext: Die AI erhält für jede Anfrage Wissen, einen sogenannten Prompt mit entsprechendem Kontext: z.B. Firmenname, Öffnungszeiten, Produktinfos. Danach kombiniert der Dialogmanager allgemeines Sprachwissen mit diesem Kontext, um zutreffende Antworten zu formulieren. Dies passiert alles vollautomatisch.