🦞
튜토리얼

음성 모드 (Talk Mode)

ElevenLabs TTS를 사용하여 OpenClaw와 자연스러운 음성 대화를 나눠보세요.

🎙️ Talk Mode란?

Talk Mode는 OpenClaw와 자연스러운 음성 대화를 가능하게 합니다. 자연스럽게 말하면 ElevenLabs가 구동하는 생동감 있는 음성으로 AI가 응답합니다.

작동 방식:

웨이크 워드 또는 푸시 투 토크 대기음성을 텍스트로 변환 (Whisper)AI로 처리 (Claude, GPT 등)응답을 음성으로 변환 (ElevenLabs)

Talk Mode는 텍스트 음성 변환을 위해 ElevenLabs API 키가 필요합니다. 음성 텍스트 변환은 Whisper(OpenAI 또는 로컬)를 사용합니다.

요구 사항

ElevenLabs API 키

필수

elevenlabs.io에서 가입하세요

플랫폼

macOS, iOS, Android

음성 입력은 네이티브 앱이 필요합니다

권한

마이크 접근 권한

요청 시 허용하세요

설정 단계

1

ElevenLabs API 키 받기

ElevenLabs에 가입하고 API 키를 받으세요:

  • elevenlabs.io에서 계정을 만드세요
  • 프로필 → API 키로 이동하세요
  • API 키를 복사하세요
2

OpenClaw 설정

openclaw.json에 ElevenLabs 설정을 추가하세요:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true
  }
}
3

환경 변수 설정

또는 API 키를 환경 변수로 설정할 수 있습니다:

export ELEVENLABS_API_KEY="your_api_key_here"
4

Talk Mode 시작

OpenClaw 메뉴 바 앱 또는 CLI에서 Talk Mode를 활성화하세요:

  • OpenClaw 메뉴 바 아이콘을 클릭하세요
  • 'Start Talk Mode'를 선택하세요
  • 또는 실행: openclaw talk
전체 설정 옵션

사용 가능한 모든 음성 설정 옵션:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true,
    "stability": 0.5,
    "similarityBoost": 0.75,
    "style": 0.5,
    "speakerBoost": true
  }
}
  • elevenlabs.apiKeyElevenLabs API 키
  • elevenlabs.voiceId사용할 음성 ID (기본값: Rachel)
  • elevenlabs.model사용할 모델 (eleven_monolingual_v1, eleven_multilingual_v2)
  • voice.wakeWord활성화 웨이크 워드 (기본값: 'Hey Claw')
  • voice.pushToTalk웨이크 워드 대신 푸시 투 토크 사용
  • voice.silenceTimeout중지 전 무음 시간(초) (기본값: 2)
음성 별칭

다양한 음성 개성 간에 쉽게 전환하세요.

{
  "talk": {
    "voiceId": "default",
    "voices": {
      "default": "EXAVITQu4vr4xnSDxMaL",
      "professional": "21m00Tcm4TlvDq8ikWAM",
      "friendly": "AZnzlk1XvdvUeBnXmlld",
      "narrator": "pNInz6obpgDQGcFmaJgB"
    }
  }
}

사용 가능한 음성

기본 (Rachel)

따뜻하고 자연스러운 여성 음성

전문가 (Adam)

명확하고 권위 있는 남성 음성

친근함 (Bella)

캐주얼하고 친근한 여성 음성

내레이터 (Antoni)

깊고 스토리텔링에 적합한 남성 음성

'전문가 음성 사용'이라고 말하거나 설정에서 음성을 전환하세요.

플랫폼 기능

macOS
  • 빠른 토글이 가능한 메뉴 바 앱
  • 푸시 투 토크용 전역 단축키
  • 시스템 오디오 통합
  • 웨이크 워드 감지
iOS & Android
  • 컴패니언 앱에서 음성 입력
  • 백그라운드 웨이크 워드 감지
  • Bluetooth 헤드셋 지원
  • 햅틱 피드백
음성 명령어

음성 명령으로 OpenClaw를 제어하세요:

// Per-reply voice control
{
  "voice": "narrator",
  "speed": 1.1,
  "stability": 0.8
}

This response will be spoken in the narrator voice at slightly faster speed.

사용 가능한 명령어

  • Stop현재 음성 재생 중지
  • Pause일시 정지하고 추가 입력 대기
  • Cancel현재 요청 취소
  • Repeat마지막 응답 반복
  • Slower/Faster음성 속도 조절
메시지 TTS

수신 메시지에 대한 텍스트 음성 변환 설정:

{
  "tts": {
    "enabled": true,
    "mode": "tagged",
    "provider": "elevenlabs",
    "voiceId": "EXAVITQu4vr4xnSDxMaL"
  }
}

TTS 모드

always

모든 메시지를 소리로 읽기

추천 용도: 핸즈프리 작업

inbound

수신 메시지만 읽기

추천 용도: 다른 채널로 전송할 때

tagged

@voice 태그된 메시지만 읽기

추천 용도: 선택적 음성 출력

지원 제공업체

  • ElevenLabsElevenLabs (최고 품질)
  • OpenAIOpenAI TTS (빠르고 좋은 품질)
💡 팁 & 모범 사례
  • 조용한 환경음성 인식은 배경 소음이 최소화된 조용한 환경에서 가장 잘 작동합니다.
  • 명확하게 말하기보통 속도로 말하세요. 문장 사이에 약간 멈추면 전사 정확도가 향상됩니다.
  • 헤드폰 사용헤드폰은 에코를 방지하고 웨이크 워드 감지를 개선합니다.
  • 크레딧 확인ElevenLabs에는 사용 제한이 있습니다. 중단을 피하려면 크레딧을 모니터링하세요.

음성 모드 준비 완료!

핸즈프리로 AI 어시스턴트와 대화를 시작하세요.