Голосовой режим (Talk Mode)
Ведите естественные голосовые разговоры с OpenClaw, используя ElevenLabs TTS.
Talk Mode позволяет вести естественные голосовые разговоры с OpenClaw. Говорите естественно, и ваш ИИ отвечает реалистичной речью на базе ElevenLabs.
Как это работает:
Talk Mode требует API-ключ ElevenLabs для синтеза речи. Распознавание речи использует Whisper (OpenAI или локальный).
Требования
API-ключ ElevenLabs
Обязательно
Зарегистрируйтесь на elevenlabs.io
Платформа
macOS, iOS, Android
Голосовой ввод требует нативных приложений
Разрешения
Доступ к микрофону
Предоставьте при запросе
Шаги настройки
Получите API-ключ ElevenLabs
Зарегистрируйтесь в ElevenLabs и получите API-ключ:
- • Перейдите на elevenlabs.io и создайте аккаунт
- • Перейдите в Профиль → API Key
- • Скопируйте ваш API-ключ
Настройте OpenClaw
Добавьте конфигурацию ElevenLabs в ваш openclaw.json:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true
}
}Установите переменную окружения
Альтернативно, установите API-ключ как переменную окружения:
export ELEVENLABS_API_KEY="your_api_key_here"
Запустите Talk Mode
Включите голосовой режим из приложения OpenClaw в меню-баре или CLI:
- • Нажмите на иконку OpenClaw в меню-баре
- • Выберите 'Start Talk Mode'
- • Или выполните: openclaw talk
Все доступные параметры голосовой конфигурации:
{
"talk": {
"voiceId": "EXAVITQu4vr4xnSDxMaL",
"modelId": "eleven_v3",
"outputFormat": "mp3_44100_128",
"apiKey": "${ELEVENLABS_API_KEY}",
"interruptOnSpeech": true,
"stability": 0.5,
"similarityBoost": 0.75,
"style": 0.5,
"speakerBoost": true
}
}elevenlabs.apiKey— Ваш API-ключ ElevenLabselevenlabs.voiceId— ID голоса (по умолчанию: Rachel)elevenlabs.model— Используемая модель (eleven_monolingual_v1, eleven_multilingual_v2)voice.wakeWord— Ключевое слово для активации (по умолчанию: 'Hey Claw')voice.pushToTalk— Использовать нажатие кнопки вместо ключевого словаvoice.silenceTimeout— Секунды тишины до остановки (по умолчанию: 2)
Легко переключайтесь между разными голосовыми персонажами.
{
"talk": {
"voiceId": "default",
"voices": {
"default": "EXAVITQu4vr4xnSDxMaL",
"professional": "21m00Tcm4TlvDq8ikWAM",
"friendly": "AZnzlk1XvdvUeBnXmlld",
"narrator": "pNInz6obpgDQGcFmaJgB"
}
}
}Доступные голоса
Тёплый, естественный женский голос
Чёткий, авторитетный мужской голос
Непринуждённый, располагающий женский голос
Глубокий, повествовательный мужской голос
Переключайте голоса, сказав 'Use professional voice' или в настройках конфигурации.
Функции платформ
- ✓Приложение в меню-баре с быстрым переключением
- ✓Глобальная горячая клавиша для нажатия-и-говори
- ✓Интеграция с системным звуком
- ✓Распознавание ключевого слова
- ✓Голосовой ввод в сопутствующем приложении
- ✓Фоновое распознавание ключевого слова
- ✓Поддержка Bluetooth-гарнитуры
- ✓Тактильная обратная связь
Управляйте OpenClaw голосовыми командами:
// Per-reply voice control
{
"voice": "narrator",
"speed": 1.1,
"stability": 0.8
}
This response will be spoken in the narrator voice at slightly faster speed.Доступные команды
Stop— Остановить текущее воспроизведение речиPause— Приостановить и ожидать дополнительного вводаCancel— Отменить текущий запросRepeat— Повторить последний ответSlower/Faster— Настроить скорость речи
Настройте синтез речи для входящих сообщений:
{
"tts": {
"enabled": true,
"mode": "tagged",
"provider": "elevenlabs",
"voiceId": "EXAVITQu4vr4xnSDxMaL"
}
}Режимы TTS
alwaysЧитать все сообщения вслух
Лучше всего для: Работа без рук
inboundЧитать только входящие сообщения
Лучше всего для: При отправке через другие каналы
taggedЧитать сообщения с тегом @voice
Лучше всего для: Выборочный голосовой вывод
Поддерживаемые провайдеры
- ElevenLabs — ElevenLabs (наивысшее качество)
- OpenAI — OpenAI TTS (быстрый, хорошее качество)
- •Тихая обстановка — Распознавание голоса лучше всего работает в тихой обстановке с минимальным фоновым шумом.
- •Говорите чётко — Говорите в нормальном темпе. Небольшие паузы между предложениями улучшают точность транскрипции.
- •Используйте наушники — Наушники предотвращают эхо и улучшают распознавание ключевого слова.
- •Проверяйте кредиты — У ElevenLabs есть лимиты использования. Следите за кредитами, чтобы избежать перебоев.
Голосовой режим готов!
Начните общаться с вашим ИИ-ассистентом без рук.