Sprachdienst-Profile

Im Folgenden erfahren Sie, wie Sie in der Navigationsleiste unter Sprachdienst-Profile die Speech-to-Text- oder Text-to-Speech-Profile anpassen, abhängig davon, welchen Anbieter Sie verwenden. Sie können verschiedene Sprachen wählen, um darzustellen, welche Sprachen Ihr Profil unterstützt.

Im Folgenden erfahren Sie, wie Sie ein Speech-to-Text-Profil erstellen oder löschen.

So erstellen Sie ein Speech-to-Text-Profil:

Voraussetzung

  1. Sie haben vom Anbieter Ihres Speech-to-Text-Sprachdienstes die REST-Endpunkt-ID und den Produktschlüssel erhalten.
  1. Klicken Sie in der Navigationsleiste auf Administration > Sprachdienst-Profile > Speech-to-Text-Profile > .
  2. Wählen Sie unter Profil-Basisdaten einen Sprachdienst.
  3. Geben Sie einen Profilnamen ein.
  4. Wählen Sie unter Unterstützte Sprachen mindestens eine Sprache, um zu verdeutlichen, welche Sprachen von Ihrem Profil unterstützt werden.
  5. Wählen Sie unter Statischer Gain die statische Anpassung der Verstärkung, die auf die Eingangslautstärke von Anrufer:innen angewendet werden soll. Mit dem Wert „0“ lassen Sie die Eingangslautstärke unverändert.
  6. Wenn Sie möchten, dass die Eingangslautstärke von Anrufer:innen automatisch auf ein einheitliches Level gebracht wird, dann aktivieren Sie den Schalter Automatic Gain Control. Sie können das automatisch regulierte, einheitliche Level mit Hilfe des Schiebereglers Statischer Gain festlegen.
  7. Abhängig vom gewählten Anbieter können Sie unter (Anbieter) Erweiterte Einstellungen weitere Einstellungen vornehmen.
  8. Wenn Sie Microsoft gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  9. Wenn Sie Streaming aktivieren möchten, dann schieben Sie den Schalter auf Streaming aktiviert.
  10. Wenn Sie möchten, dass Schimpfwörter in den Transkriptionsergebnissen mit Asterisken zensiert werden, dann schieben Sie den Schalter auf Schimpfwörter herausfiltern.
  11. Geben Sie eine REST-Endpunkt-ID ein.
  12. Wählen Sie eine Azure-Region.
    Tipp: Wenn keine Azure-Region hinterlegt wird, wird westeurope als Standard verwendet.
  13. Geben Sie einen Produktschlüssel ein.

    Tipp: Wenn Sie im Feld Produktschlüssel nichts eingeben, wird automatisch das Standard-Sprachdienst-Profil von VIER verwendet.

    Hinweis: Der Produktschlüssel ist nur beim Neuanlegen eines Speech-to-Text-Profils sichtbar. Nach dem Speichern des Speech-to-Text-Profils wird der Produktschlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie den Produktschlüssel durch einen neuen ersetzen, falls nötig.
  14. Wenn Sie Begriffe angeben möchten, die bei der Transkription bevorzugt erkannt werden sollen, dann geben Sie diese unter Bevorzugte Begriffe ein.

    Tipp: Bestätigen Sie jeden eingegebenen Begriff mit der Enter-Taste.

    Tipp: Wenn Sie für bestimmte Abschnitte im Dialog Begriffe verwenden möchten, die bei der Transkription erkannt werden, dann müssen Sie diese über den API-Endpunkt /call/transcription/switch angeben. Für weitere Informationen https://cognitivevoice.io/specs/#/call/switchTranscription.
  15. Wenn Sie Google gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  16. Wenn Sie Streaming aktivieren möchten, dann schieben Sie den Schalter auf Streaming aktiviert.
  17. Wenn Sie möchten, dass anstößige Wörter in den Transkriptionsergebnissen mit Asterisken zensiert werden, dann schieben Sie den Schalter auf Anstößige Wörter herausfiltern.
  18. Wenn Sie Begriffe angeben möchten, die bei der Transkription bevorzugt erkannt werden sollen, dann geben Sie diese unter Bevorzugte Begriffe ein.

    Tipp: Bestätigen Sie jeden eingegebenen Begriff mit der Enter-Taste.

    Tipp: Wenn Sie für bestimmte Abschnitte im Dialog Begriffe verwenden möchten, die bei der Transkription erkannt werden, dann müssen Sie diese über den API-Endpunkt /call/transcription/switch angeben. Für weitere Informationen https://cognitivevoice.io/specs/#/call/switchTranscription.
  19. Wählen Sie das passende Speech-to-Text-Modell. Für detaillierte Informationen zu den einzelnen Speech-to-Text-Modellen siehe https://cloud.google.com/speech-to-text/v2/docs/transcription-model?hl=de.
  • Unter Zugangsdaten für Dienstkonto können Sie die JSON-Datei hochladen, die Sie erhalten haben, als Sie das Dienstkonto bei Google angelegt haben. Diese JSON-Datei enthält die Zugangsdaten, die für die Integration mit VIER Cognitive Voice Gateway erforderlich ist.

    Hinweis: Die Zugangsdaten für Ihr Dienstkonto sind nur beim Neuanlegen eines Speech-to-Text-Profils sichtbar. Nach dem Speichern des Speech-to-Text-Profils werden die Zugangsdaten nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Zugangsdaten durch neue ersetzen, falls nötig.
  1. Wenn Sie IBM gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  2. Wenn Sie möchten, dass anstößige Wörter in den Transkriptionsergebnissen mit Asterisken zensiert werden, dann schieben Sie den Schalter auf Anstößige Wörter herausfiltern.
  3. Geben Sie die Server-URL ein, die Sie von IBM erhalten haben.
  4. Geben Sie den API-Schlüssel ein, den Sie von IBM erhalten haben.

    Hinweis: Die Server-URL und der API-Schlüssel sind nur beim Neuanlegen eines Speech-to-Text-Profils sichtbar. Nach dem Speichern des Speech-to-Text-Profils werden die Server-URL und der API-Schlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Server-URL und den API-Schlüssel durch neue Daten ersetzen, falls nötig.
  5. Wenn Sie Deepgram gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  6. Geben Sie unter Modell das Deepgram-Modell ein, das Sie verwenden möchten.
  7. Wenn Sie OpenAI Whisper (US-hosted) gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  8. Geben Sie die Bereitstellungs-URL ein, die Sie von OpenAI erhalten haben.
  9. Geben Sie den API-Schlüssel ein.

    Hinweis: Die Bereitstellungs-URL und der API-Schlüssel sind nur beim Neuanlegen eines Speech-to-Text-Profils sichtbar. Nach dem Speichern des Speech-to-Text-Profils werden die Bereitstellungs-URL und der API-Schlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Bereitstellungs-URL und den API-Schlüssel durch neue Daten ersetzen, falls nötig.
  10. Weisen Sie unter Prompt für Anweisen des Sprachdienstes den Sprachdienst an, wie er sich bei der Transkription verhalten soll.
  11. Wenn Sie VIER gewählt haben, dann nehmen Sie folgende Einstellungen vor oder geben Sie folgende Daten ein:
  12. Weisen Sie unter Prompt für Anweisen des Sprachdienstes den Sprachdienst an, wie er sich bei der Transkription verhalten soll.
  13. Klicken Sie auf Speichern.
  1. Ihr Speech-to-Text-Profil wurde gespeichert.
  2. Sprachdienst-Profile - Speech-to-Text-Profil

So löschen Sie ein Speech-to-Text-Profil:

  1. Klicken Sie in der Navigationsleiste unter Administration auf Sprachdienst-Profile.
  2. Wählen Sie das Speech-to-Text-Profil, das Sie löschen möchten.
  3. Wählen Sie Bearbeiten und klicken Sie auf Löschen.
  4. Klicken Sie auf Bestätigen.
  1. Ihr Speech-to-Text-Profil wurde gelöscht.

Im Folgenden erfahren Sie, wie Sie ein Text-to-Speech-Profil erstellen oder löschen.

Im Folgenden erfahren Sie, wie Sie ein Text-to-Speech-Profil erstellen. Dafür müssen Sie folgende Aktionen durchführen:

  • Profil-Basisdaten eintragen
  • Stimme einrichten
  • Je nach Sprachdienst erweiterte Einstellungen vornehmen

Profil-Basisdaten eintragen

So tragen Sie die Profil-Basisdaten ein:

  1. Klicken Sie in der Navigationsleiste auf Administration > Sprachdienst-Profile > Text-to-Speech-Profile > .
  2. Wählen Sie unter Profil-Basisdaten einen Sprachdienst.
  3. Geben Sie einen Profilnamen ein.
  1. Sie haben die Profil-Basisdaten eingetragen.

Stimme einrichten

So richten Sie die Stimme ein:

  1. Klicken Sie auf .
  2. Wählen Sie unter Stimme mindestens eine Sprache.
  3. Geben Sie die Stimmenbezeichnung des Herstellers ein.

Erweiterte Einstellungen vornehmen

  1. Wenn Sie ElevenLabs (US-hosted) gewählt haben, dann können Sie unter ElevenLabs (US-hosted) Erweiterte Einstellungen die Daten Ihres ElevenLabs-Accounts eingeben.
  2. Geben Sie das ElevenLabs-Modell ein, das Sie verwenden möchten.
  3. Geben Sie den API-Schlüssel ein.

    Hinweis:
    Der API-Schlüssel ist nur beim Neuanlegen eines Text-to-Speech-Profils sichtbar. Nach dem Speichern des Text-to-Speech-Profils wird der API-Schlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie den API-Schlüssel durch einen neuen API-Schlüssel ersetzen, falls nötig.
  4. oder
    Wenn Sie OpenAI gewählt haben, dann können Sie unter OpenAI Erweiterte Einstellungen die Sprechgeschwindigkeit einstellen.
  5. oder
    Wenn Sie Google gewählt haben, dann können Sie unter Google Erweiterte Einstellungen die Sprechgeschwindigkeit einstellen.
  6. Geben Sie die Zugangsdaten für Ihr Google-Dienstkonto ein oder klicken Sie auf Lade Zugangsdaten aus JSON-Datei und wählen Sie die Datei, die die Daten enthält.

    Hinweis: Die Zugangsdaten für Ihr Dienstkonto sind nur beim Neuanlegen eines Text-to-Speech-Profils sichtbar. Nach dem Speichern des Text-to-Speech-Profils werden die Zugangsdaten nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Zugangsdaten durch neue ersetzen, falls nötig.
  7. oder
    Wenn Sie Amazon gewählt haben, dann können Sie unter Amazon Erweiterte Einstellungen die Daten Ihres Amazon Service-Accounts eingeben.
  8. Geben Sie die Zugriffsschlüssel-ID ein.
  9. Geben Sie den Geheimen Zugriffsschlüssel ein.

    Hinweis: Die Zugriffsschlüssel-ID und der geheime Zugriffsschlüssel sind nur beim Neuanlegen eines Text-to-Speech-Profils sichtbar. Nach dem Speichern des Text-to-Speech-Profils werden die Zugriffsschlüssel-ID und der geheime Zugriffsschlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Daten durch neue Daten ersetzen, falls nötig.
  10. oder
    Wenn Sie Microsoft gewählt haben, dann können Sie unter Microsoft Erweiterte Einstellungen die Daten Ihres Microsoft Service-Accounts eingeben.
  11. Geben Sie die REST-Endpunkt-URL ein.
  12. Geben Sie die Authentifizierungs-URL ein.
  13. Geben Sie den Produktschlüssel ein.

    Hinweis: Die REST-Endpunkt-URL, die Authentifizierungs-URL und der Produktschlüssel sind nur beim Neuanlegen eines Text-to-Speech-Profils sichtbar. Nach dem Speichern des Text-to-Speech-Profils werden diese Daten nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Daten durch neue Daten ersetzen, falls nötig.
  14. oder
    Wenn Sie IBM gewählt haben, dann können Sie unter IBM Erweiterte Einstellungen die Sprechgeschwindigkeit einstellen.
  15. Geben Sie die Server-URL Ihres IBM-Service-Accounts ein.
  16. Geben Sie den API-Schlüssel Ihres IBM-Service-Accounts ein.

    Hinweis: Die Server-URL und der API-Schlüssel sind nur beim Neuanlegen eines Text-to-Speech-Profils sichtbar. Nach dem Speichern des Text-to-Speech-Profils werden die Server-URL und der API-Schlüssel nur noch verschlüsselt dargestellt, auch im Bearbeitungsmodus. In diesem Fall können Sie die Daten durch neue Daten ersetzen, falls nötig.
  17. Klicken Sie auf Speichern.
  1. Sie haben die Stimme eingerichtet.
  2. Sie haben das Text-to-Speech-Profil erstellt.

 

So löschen Sie ein Text-to-Speech-Profil:

  1. Klicken Sie in der Navigationsleiste unter Administration auf Sprachdienst-Profile.
  2. Wählen Sie das Text-to-Speech-Profil, das Sie löschen möchten.
  3. Klicken Sie auf Bearbeiten und anschließend auf Löschen.
  4. Klicken Sie auf Bestätigen.
  1. Ihr Text-to-Speech-Profil wurde gelöscht.