Tutoriel

Mode Vocal (Mode Conversation)

Ayez des conversations vocales naturelles avec OpenClaw en utilisant ElevenLabs TTS.

🎙️ Qu'est-ce que le Mode Conversation ?

Le Mode Conversation permet des conversations vocales naturelles avec OpenClaw. Parlez naturellement et votre IA vous repond avec une voix realiste grace a ElevenLabs.

Comment ca fonctionne :

Ecoute du mot declencheur ou appui-pour-parler→Transcription de la parole en texte (Whisper)→Traitement par l'IA (Claude, GPT, etc.)→Conversion de la reponse en parole (ElevenLabs)

Le Mode Conversation necessite une cle API ElevenLabs pour la synthese vocale. La reconnaissance vocale utilise Whisper (OpenAI ou local).

Prerequis

Cle API ElevenLabs

Requis

Inscrivez-vous sur elevenlabs.io

Plateforme

macOS, iOS, Android

L'entree vocale necessite les applications natives

Permissions

Acces au microphone

Accordez l'acces lorsque demande

Etapes de configuration

Obtenir la cle API ElevenLabs

Inscrivez-vous sur ElevenLabs et obtenez votre cle API :

• Allez sur elevenlabs.io et creez un compte
• Naviguez vers Profil → Cle API
• Copiez votre cle API

Configurer OpenClaw

Ajoutez la configuration ElevenLabs a votre openclaw.json :

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true
  }
}

Definir la variable d'environnement

Alternativement, definissez votre cle API comme variable d'environnement :

export ELEVENLABS_API_KEY="your_api_key_here"

Demarrer le Mode Conversation

Activez le mode conversation depuis l'application de barre de menu OpenClaw ou le CLI :

• Cliquez sur l'icone OpenClaw dans la barre de menu
• Selectionnez 'Demarrer le Mode Conversation'
• Ou executez : openclaw talk

Options de configuration completes

Toutes les options de configuration vocale disponibles :

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true,
    "stability": 0.5,
    "similarityBoost": 0.75,
    "style": 0.5,
    "speakerBoost": true
  }
}

elevenlabs.apiKey — Votre cle API ElevenLabs
elevenlabs.voiceId — ID de la voix a utiliser (par defaut : Rachel)
elevenlabs.model — Modele a utiliser (eleven_monolingual_v1, eleven_multilingual_v2)
voice.wakeWord — Mot declencheur pour activer (par defaut : 'Hey Claw')
voice.pushToTalk — Utiliser appui-pour-parler au lieu du mot declencheur
voice.silenceTimeout — Secondes de silence avant l'arret (par defaut : 2)

Alias de voix

Changez facilement entre differentes personnalites vocales.

{
  "talk": {
    "voiceId": "default",
    "voices": {
      "default": "EXAVITQu4vr4xnSDxMaL",
      "professional": "21m00Tcm4TlvDq8ikWAM",
      "friendly": "AZnzlk1XvdvUeBnXmlld",
      "narrator": "pNInz6obpgDQGcFmaJgB"
    }
  }
}

Voix disponibles

Par defaut (Rachel)

Voix feminine chaleureuse et naturelle

Professionnelle (Adam)

Voix masculine claire et autoritaire

Amicale (Bella)

Voix feminine decontractee et accessible

Narrateur (Antoni)

Voix masculine profonde, style conteur

Changez de voix en disant 'Utiliser la voix professionnelle' ou en configurant dans le fichier config.

Fonctionnalites par plateforme

macOS

✓Application de barre de menu avec activation rapide
✓Raccourci global pour appui-pour-parler
✓Integration audio systeme
✓Detection du mot declencheur

iOS & Android

✓Entree vocale dans l'application compagnon
✓Detection du mot declencheur en arriere-plan
✓Support des casques Bluetooth
✓Retour haptique

Directives vocales

Controlez OpenClaw avec des commandes vocales :

// Per-reply voice control
{
  "voice": "narrator",
  "speed": 1.1,
  "stability": 0.8
}

This response will be spoken in the narrator voice at slightly faster speed.

Commandes disponibles

Stop — Arreter la lecture vocale en cours
Pause — Mettre en pause et attendre plus d'entree
Cancel — Annuler la requete en cours
Repeat — Repeter la derniere reponse
Slower/Faster — Ajuster la vitesse de parole

TTS pour les messages

Configurez la synthese vocale pour les messages entrants :

{
  "tts": {
    "enabled": true,
    "mode": "tagged",
    "provider": "elevenlabs",
    "voiceId": "EXAVITQu4vr4xnSDxMaL"
  }
}

Modes TTS

always

Lire tous les messages a voix haute

Ideal pour: Utilisation mains libres

inbound

Lire uniquement les messages entrants

Ideal pour: Lors de l'envoi via d'autres canaux

tagged

Lire les messages tagges avec @voice

Ideal pour: Sortie vocale selective

Fournisseurs pris en charge

ElevenLabs — ElevenLabs (meilleure qualite)
OpenAI — OpenAI TTS (rapide, bonne qualite)

💡 Conseils et bonnes pratiques

•Environnement calme — La reconnaissance vocale fonctionne mieux dans des environnements calmes avec un minimum de bruit de fond.
•Parlez clairement — Parlez a un rythme normal. Faire une legere pause entre les phrases ameliore la precision de la transcription.
•Utilisez des ecouteurs — Les ecouteurs evitent l'echo et ameliorent la detection du mot declencheur.
•Verifiez vos credits — ElevenLabs a des limites d'utilisation. Surveillez vos credits pour eviter les interruptions.

Mode Vocal pret !

Commencez a parler a votre assistant IA en mains libres.

Installer OpenClaw Explorer les competences