Sprachmodus (Talk Mode)
Fuehre natuerliche Sprachgespraeche mit OpenClaw mittels ElevenLabs TTS.
Der Talk Mode ermoeglicht natuerliche Sprachgespraeche mit OpenClaw. Sprich natuerlich, und deine KI antwortet mit lebensechter Sprache, angetrieben von ElevenLabs.
So funktioniert es:
Der Talk Mode erfordert einen ElevenLabs API-Schluessel fuer Text-zu-Sprache. Sprache-zu-Text verwendet Whisper (OpenAI oder lokal).
Voraussetzungen
ElevenLabs API-Schluessel
Erforderlich
Registriere dich bei elevenlabs.io
Plattform
macOS, iOS, Android
Spracheingabe erfordert native Apps
Berechtigungen
Mikrofonzugriff
Bei Aufforderung gewaehren
Einrichtungsschritte
ElevenLabs API-Schluessel erhalten
Registriere dich bei ElevenLabs und hole dir deinen API-Schluessel:
- âą Gehe zu elevenlabs.io und erstelle ein Konto
- âą Navigiere zu Profil â API-Schluessel
- âą Kopiere deinen API-Schluessel
OpenClaw konfigurieren
Fuege die ElevenLabs-Konfiguration zu deiner openclaw.json hinzu:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true
}
}Umgebungsvariable setzen
Alternativ kannst du deinen API-Schluessel als Umgebungsvariable setzen:
export ELEVENLABS_API_KEY="your_api_key_here"
Talk Mode starten
Aktiviere den Talk Mode ueber die OpenClaw-Menueleisten-App oder CLI:
- âą Klicke auf das OpenClaw-Symbol in der Menueleiste
- âą Waehle 'Talk Mode starten'
- âą Oder fuehre aus: openclaw talk
Alle verfuegbaren Sprachkonfigurationsoptionen:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true,
"stability": 0.5,
"similarityBoost": 0.75,
"style": 0.5,
"speakerBoost": true
}
}elevenlabs.apiKeyâ Dein ElevenLabs API-Schluesselelevenlabs.voiceIdâ Zu verwendende Stimmen-ID (Standard: Rachel)elevenlabs.modelâ Zu verwendendes Modell (eleven_monolingual_v1, eleven_multilingual_v2)voice.wakeWordâ Aktivierungswort (Standard: 'Hey Claw')voice.pushToTalkâ Push-to-Talk anstelle des Aktivierungswortes verwendenvoice.silenceTimeoutâ Sekunden Stille vor dem Stoppen (Standard: 2)
Wechsle einfach zwischen verschiedenen Stimmpersoenlichkeiten.
{
"talk": {
"voiceId": "default",
"voices": {
"default": "EXAVITQu4vr4xnSDxMaL",
"professional": "21m00Tcm4TlvDq8ikWAM",
"friendly": "AZnzlk1XvdvUeBnXmlld",
"narrator": "pNInz6obpgDQGcFmaJgB"
}
}
}Verfuegbare Stimmen
Warme, natuerliche weibliche Stimme
Klare, autoritaere maennliche Stimme
Laessige, zugaengliche weibliche Stimme
Tiefe, erzaehlende maennliche Stimme
Wechsle Stimmen, indem du 'Verwende professionelle Stimme' sagst oder in der Konfiguration einstellst.
Plattformfunktionen
- âMenueleisten-App mit Schnellumschaltung
- âGlobale Tastenkombination fuer Push-to-Talk
- âSystem-Audio-Integration
- âAktivierungswort-Erkennung
- âSpracheingabe in der Begleit-App
- âAktivierungswort-Erkennung im Hintergrund
- âBluetooth-Headset-Unterstuetzung
- âHaptisches Feedback
Steuere OpenClaw mit Sprachbefehlen:
// Per-reply voice control
{
"voice": "narrator",
"speed": 1.1,
"stability": 0.8
}
This response will be spoken in the narrator voice at slightly faster speed.Verfuegbare Befehle
Stoppâ Aktuelle Sprachwiedergabe stoppenPauseâ Pausieren und auf weitere Eingabe wartenAbbrechenâ Aktuelle Anfrage abbrechenWiederholenâ Die letzte Antwort wiederholenLangsamer/Schnellerâ Sprechgeschwindigkeit anpassen
Konfiguriere Text-zu-Sprache fuer eingehende Nachrichten:
{
"tts": {
"enabled": true,
"mode": "tagged",
"provider": "elevenlabs",
"voiceId": "EXAVITQu4vr4xnSDxMaL"
}
}TTS-Modi
alwaysAlle Nachrichten vorlesen
Ideal fuer: Freisprechbetrieb
inboundNur eingehende Nachrichten vorlesen
Ideal fuer: Beim Senden ueber andere Kanaele
taggedMit @voice markierte Nachrichten vorlesen
Ideal fuer: Selektive Sprachausgabe
Unterstuetzte Anbieter
- ElevenLabs â ElevenLabs (hoechste Qualitaet)
- OpenAI â OpenAI TTS (schnell, gute Qualitaet)
- âąRuhige Umgebung â Spracherkennung funktioniert am besten in ruhigen Umgebungen mit minimalen Hintergrundgeraeuschen.
- âąDeutlich sprechen â Sprich in normalem Tempo. Leichtes Pausieren zwischen Saetzen verbessert die Transkriptionsgenauigkeit.
- âąKopfhoerer verwenden â Kopfhoerer verhindern Echo und verbessern die Aktivierungswort-Erkennung.
- âąGuthaben pruefen â ElevenLabs hat Nutzungslimits. Ueberwache dein Guthaben, um Unterbrechungen zu vermeiden.
Sprachmodus bereit!
Beginne, mit deinem KI-Assistenten freiheandig zu sprechen.