🦞
Tutorial

Modo de Voz (Talk Mode)

Tenha conversas naturais por voz com o OpenClaw usando ElevenLabs TTS.

πŸŽ™οΈ O que e o Talk Mode?

O Talk Mode permite conversas naturais por voz com o OpenClaw. Fale naturalmente e sua IA responde com fala realista alimentada pelo ElevenLabs.

Como funciona:

Escuta a palavra de ativacao ou pressionar para falar→Transcreve fala para texto (Whisper)→Processa com IA (Claude, GPT, etc.)→Converte resposta para fala (ElevenLabs)

O Talk Mode requer uma chave de API do ElevenLabs para texto-para-fala. Fala-para-texto usa Whisper (OpenAI ou local).

Requisitos

Chave de API ElevenLabs

Obrigatorio

Cadastre-se em elevenlabs.io

Plataforma

macOS, iOS, Android

Entrada de voz requer apps nativos

Permissoes

Acesso ao microfone

Conceda quando solicitado

Passos de Configuracao

1

Obter Chave de API ElevenLabs

Cadastre-se no ElevenLabs e obtenha sua chave de API:

  • β€’ Acesse elevenlabs.io e crie uma conta
  • β€’ Navegue ate Perfil -> Chave de API
  • β€’ Copie sua chave de API
2

Configurar OpenClaw

Adicione a configuracao do ElevenLabs ao seu openclaw.json:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true
  }
}
3

Definir Variavel de Ambiente

Alternativamente, defina sua chave de API como uma variavel de ambiente:

export ELEVENLABS_API_KEY="your_api_key_here"
4

Iniciar Talk Mode

Ative o talk mode a partir do app da barra de menu do OpenClaw ou CLI:

  • β€’ Clique no icone do OpenClaw na barra de menu
  • β€’ Selecione 'Iniciar Talk Mode'
  • β€’ Ou execute: openclaw talk
Opcoes Completas de Configuracao

Todas as opcoes de configuracao de voz disponiveis:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true,
    "stability": 0.5,
    "similarityBoost": 0.75,
    "style": 0.5,
    "speakerBoost": true
  }
}
  • elevenlabs.apiKey β€” Sua chave de API ElevenLabs
  • elevenlabs.voiceId β€” ID da voz a usar (padrao: Rachel)
  • elevenlabs.model β€” Modelo a usar (eleven_monolingual_v1, eleven_multilingual_v2)
  • voice.wakeWord β€” Palavra de ativacao (padrao: 'Hey Claw')
  • voice.pushToTalk β€” Usar pressionar-para-falar em vez de palavra de ativacao
  • voice.silenceTimeout β€” Segundos de silencio antes de parar (padrao: 2)
Aliases de Voz

Alterne facilmente entre diferentes personalidades de voz.

{
  "talk": {
    "voiceId": "default",
    "voices": {
      "default": "EXAVITQu4vr4xnSDxMaL",
      "professional": "21m00Tcm4TlvDq8ikWAM",
      "friendly": "AZnzlk1XvdvUeBnXmlld",
      "narrator": "pNInz6obpgDQGcFmaJgB"
    }
  }
}

Vozes Disponiveis

Padrao (Rachel)

Voz feminina calorosa e natural

Profissional (Adam)

Voz masculina clara e autoritaria

Amigavel (Bella)

Voz feminina casual e acessivel

Narrador (Antoni)

Voz masculina profunda, estilo narrador

Alterne vozes dizendo 'Usar voz profissional' ou configurando no config.

Recursos por Plataforma

macOS
  • βœ“App na barra de menu com alternancia rapida
  • βœ“Atalho global para pressionar-para-falar
  • βœ“Integracao com audio do sistema
  • βœ“Deteccao de palavra de ativacao
iOS & Android
  • βœ“Entrada de voz no app complementar
  • βœ“Deteccao de palavra de ativacao em segundo plano
  • βœ“Suporte a fones Bluetooth
  • βœ“Feedback haptico
Comandos de Voz

Controle o OpenClaw com comandos de voz:

// Per-reply voice control
{
  "voice": "narrator",
  "speed": 1.1,
  "stability": 0.8
}

This response will be spoken in the narrator voice at slightly faster speed.

Comandos Disponiveis

  • Parar β€” Parar reproducao de fala atual
  • Pausar β€” Pausar e aguardar mais entrada
  • Cancelar β€” Cancelar solicitacao atual
  • Repetir β€” Repetir a ultima resposta
  • Mais Lento/Mais Rapido β€” Ajustar velocidade da fala
TTS para Mensagens

Configure texto-para-fala para mensagens recebidas:

{
  "tts": {
    "enabled": true,
    "mode": "tagged",
    "provider": "elevenlabs",
    "voiceId": "EXAVITQu4vr4xnSDxMaL"
  }
}

Modos TTS

always

Ler todas as mensagens em voz alta

Melhor para: Operacao maos-livres

inbound

Ler apenas mensagens recebidas

Melhor para: Ao enviar por outros canais

tagged

Ler mensagens marcadas com @voice

Melhor para: Saida de voz seletiva

Provedores Suportados

  • ElevenLabs β€” ElevenLabs (maior qualidade)
  • OpenAI β€” OpenAI TTS (rapido, boa qualidade)
πŸ’‘ Dicas e Melhores Praticas
  • β€’Ambiente Silencioso β€” O reconhecimento de voz funciona melhor em ambientes silenciosos com ruido de fundo minimo.
  • β€’Fale Claramente β€” Fale em um ritmo normal. Pausar levemente entre frases ajuda na precisao da transcricao.
  • β€’Use Fones de Ouvido β€” Fones de ouvido previnem eco e melhoram a deteccao da palavra de ativacao.
  • β€’Verifique os Creditos β€” O ElevenLabs tem limites de uso. Monitore seus creditos para evitar interrupcoes.

Modo de Voz Pronto!

Comece a conversar com seu assistente de IA maos-livres.