음성 모드 (Talk Mode)
ElevenLabs TTS를 사용하여 OpenClaw와 자연스러운 음성 대화를 나눠보세요.
Talk Mode는 OpenClaw와 자연스러운 음성 대화를 가능하게 합니다. 자연스럽게 말하면 ElevenLabs가 구동하는 생동감 있는 음성으로 AI가 응답합니다.
작동 방식:
Talk Mode는 텍스트 음성 변환을 위해 ElevenLabs API 키가 필요합니다. 음성 텍스트 변환은 Whisper(OpenAI 또는 로컬)를 사용합니다.
요구 사항
ElevenLabs API 키
필수
elevenlabs.io에서 가입하세요
플랫폼
macOS, iOS, Android
음성 입력은 네이티브 앱이 필요합니다
권한
마이크 접근 권한
요청 시 허용하세요
설정 단계
ElevenLabs API 키 받기
ElevenLabs에 가입하고 API 키를 받으세요:
- • elevenlabs.io에서 계정을 만드세요
- • 프로필 → API 키로 이동하세요
- • API 키를 복사하세요
OpenClaw 설정
openclaw.json에 ElevenLabs 설정을 추가하세요:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true
}
}환경 변수 설정
또는 API 키를 환경 변수로 설정할 수 있습니다:
export ELEVENLABS_API_KEY="your_api_key_here"
Talk Mode 시작
OpenClaw 메뉴 바 앱 또는 CLI에서 Talk Mode를 활성화하세요:
- • OpenClaw 메뉴 바 아이콘을 클릭하세요
- • 'Start Talk Mode'를 선택하세요
- • 또는 실행: openclaw talk
사용 가능한 모든 음성 설정 옵션:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true,
"stability": 0.5,
"similarityBoost": 0.75,
"style": 0.5,
"speakerBoost": true
}
}elevenlabs.apiKey— ElevenLabs API 키elevenlabs.voiceId— 사용할 음성 ID (기본값: Rachel)elevenlabs.model— 사용할 모델 (eleven_monolingual_v1, eleven_multilingual_v2)voice.wakeWord— 활성화 웨이크 워드 (기본값: 'Hey Claw')voice.pushToTalk— 웨이크 워드 대신 푸시 투 토크 사용voice.silenceTimeout— 중지 전 무음 시간(초) (기본값: 2)
다양한 음성 개성 간에 쉽게 전환하세요.
{
"talk": {
"voiceId": "default",
"voices": {
"default": "EXAVITQu4vr4xnSDxMaL",
"professional": "21m00Tcm4TlvDq8ikWAM",
"friendly": "AZnzlk1XvdvUeBnXmlld",
"narrator": "pNInz6obpgDQGcFmaJgB"
}
}
}사용 가능한 음성
따뜻하고 자연스러운 여성 음성
명확하고 권위 있는 남성 음성
캐주얼하고 친근한 여성 음성
깊고 스토리텔링에 적합한 남성 음성
'전문가 음성 사용'이라고 말하거나 설정에서 음성을 전환하세요.
플랫폼 기능
- ✓빠른 토글이 가능한 메뉴 바 앱
- ✓푸시 투 토크용 전역 단축키
- ✓시스템 오디오 통합
- ✓웨이크 워드 감지
- ✓컴패니언 앱에서 음성 입력
- ✓백그라운드 웨이크 워드 감지
- ✓Bluetooth 헤드셋 지원
- ✓햅틱 피드백
음성 명령으로 OpenClaw를 제어하세요:
// Per-reply voice control
{
"voice": "narrator",
"speed": 1.1,
"stability": 0.8
}
This response will be spoken in the narrator voice at slightly faster speed.사용 가능한 명령어
Stop— 현재 음성 재생 중지Pause— 일시 정지하고 추가 입력 대기Cancel— 현재 요청 취소Repeat— 마지막 응답 반복Slower/Faster— 음성 속도 조절
수신 메시지에 대한 텍스트 음성 변환 설정:
{
"tts": {
"enabled": true,
"mode": "tagged",
"provider": "elevenlabs",
"voiceId": "EXAVITQu4vr4xnSDxMaL"
}
}TTS 모드
always모든 메시지를 소리로 읽기
추천 용도: 핸즈프리 작업
inbound수신 메시지만 읽기
추천 용도: 다른 채널로 전송할 때
tagged@voice 태그된 메시지만 읽기
추천 용도: 선택적 음성 출력
지원 제공업체
- ElevenLabs — ElevenLabs (최고 품질)
- OpenAI — OpenAI TTS (빠르고 좋은 품질)
- •조용한 환경 — 음성 인식은 배경 소음이 최소화된 조용한 환경에서 가장 잘 작동합니다.
- •명확하게 말하기 — 보통 속도로 말하세요. 문장 사이에 약간 멈추면 전사 정확도가 향상됩니다.
- •헤드폰 사용 — 헤드폰은 에코를 방지하고 웨이크 워드 감지를 개선합니다.
- •크레딧 확인 — ElevenLabs에는 사용 제한이 있습니다. 중단을 피하려면 크레딧을 모니터링하세요.