🦞
チュートリアル

ボイスモード(トークモード)

ElevenLabs TTSを使用してOpenClawと自然な音声会話を楽しめます。

🎙️ トークモードとは?

トークモードはOpenClawとの自然な音声会話を可能にします。自然に話しかけると、ElevenLabsによるリアルな音声でAIが応答します。

仕組み:

ウェイクワードまたはプッシュトゥトークを待機音声をテキストに変換(Whisper)AIで処理(Claude、GPTなど)応答を音声に変換(ElevenLabs)

トークモードにはテキスト読み上げ用のElevenLabs APIキーが必要です。音声認識にはWhisper(OpenAIまたはローカル)を使用します。

必要条件

ElevenLabs APIキー

必須

elevenlabs.ioで登録

プラットフォーム

macOS、iOS、Android

音声入力にはネイティブアプリが必要

権限

マイクへのアクセス

プロンプトが表示されたら許可

セットアップ手順

1

ElevenLabs APIキーを取得

ElevenLabsに登録してAPIキーを取得します:

  • elevenlabs.ioにアクセスしてアカウントを作成
  • プロフィール → APIキーに移動
  • APIキーをコピー
2

OpenClawを設定

openclaw.jsonにElevenLabsの設定を追加します:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true
  }
}
3

環境変数を設定

または、環境変数としてAPIキーを設定することもできます:

export ELEVENLABS_API_KEY="your_api_key_here"
4

トークモードを開始

OpenClawのメニューバーアプリまたはCLIからトークモードを有効にします:

  • OpenClawのメニューバーアイコンをクリック
  • 「トークモードを開始」を選択
  • またはコマンド実行: openclaw talk
すべての設定オプション

利用可能なすべての音声設定オプション:

{
  "talk": {
    "voiceId": "EXAVITQu4vr4xnSDxMaL",
    "modelId": "eleven_v3",
    "outputFormat": "mp3_44100_128",
    "apiKey": "${ELEVENLABS_API_KEY}",
    "interruptOnSpeech": true,
    "stability": 0.5,
    "similarityBoost": 0.75,
    "style": 0.5,
    "speakerBoost": true
  }
}
  • elevenlabs.apiKeyElevenLabs APIキー
  • elevenlabs.voiceId使用する音声ID(デフォルト: Rachel)
  • elevenlabs.model使用するモデル(eleven_monolingual_v1、eleven_multilingual_v2)
  • voice.wakeWord起動用ウェイクワード(デフォルト: 'Hey Claw')
  • voice.pushToTalkウェイクワードの代わりにプッシュトゥトークを使用
  • voice.silenceTimeout停止するまでの無音秒数(デフォルト: 2)
音声エイリアス

異なる音声パーソナリティを簡単に切り替えられます。

{
  "talk": {
    "voiceId": "default",
    "voices": {
      "default": "EXAVITQu4vr4xnSDxMaL",
      "professional": "21m00Tcm4TlvDq8ikWAM",
      "friendly": "AZnzlk1XvdvUeBnXmlld",
      "narrator": "pNInz6obpgDQGcFmaJgB"
    }
  }
}

利用可能な音声

デフォルト(Rachel)

温かみのある自然な女性の声

プロフェッショナル(Adam)

明瞭で威厳のある男性の声

フレンドリー(Bella)

カジュアルで親しみやすい女性の声

ナレーター(Antoni)

深みのある物語調の男性の声

「プロフェッショナルボイスを使用」と言うか、設定で変更して音声を切り替えます。

プラットフォーム機能

macOS
  • クイック切り替え付きメニューバーアプリ
  • プッシュトゥトーク用グローバルホットキー
  • システムオーディオ統合
  • ウェイクワード検出
iOS & Android
  • コンパニオンアプリでの音声入力
  • バックグラウンドでのウェイクワード検出
  • Bluetoothヘッドセット対応
  • 触覚フィードバック
音声コマンド

音声コマンドでOpenClawを操作:

// Per-reply voice control
{
  "voice": "narrator",
  "speed": 1.1,
  "stability": 0.8
}

This response will be spoken in the narrator voice at slightly faster speed.

利用可能なコマンド

  • Stop現在の音声再生を停止
  • Pause一時停止して追加入力を待機
  • Cancel現在のリクエストをキャンセル
  • Repeat最後の応答を繰り返す
  • Slower/Faster音声速度を調整
メッセージのTTS

受信メッセージのテキスト読み上げを設定:

{
  "tts": {
    "enabled": true,
    "mode": "tagged",
    "provider": "elevenlabs",
    "voiceId": "EXAVITQu4vr4xnSDxMaL"
  }
}

TTSモード

always

すべてのメッセージを読み上げ

最適な用途: ハンズフリー操作

inbound

受信メッセージのみ読み上げ

最適な用途: 他のチャンネルから送信時

tagged

@voiceタグ付きメッセージのみ読み上げ

最適な用途: 選択的な音声出力

対応プロバイダー

  • ElevenLabsElevenLabs(最高品質)
  • OpenAIOpenAI TTS(高速、高品質)
💡 ヒントとベストプラクティス
  • 静かな環境音声認識は背景ノイズが少ない静かな環境で最も効果的です。
  • はっきりと話す通常のペースで話してください。文と文の間に少し間を置くと認識精度が向上します。
  • ヘッドフォンを使用ヘッドフォンはエコーを防ぎ、ウェイクワードの検出を改善します。
  • クレジットを確認ElevenLabsには使用制限があります。中断を避けるためにクレジットを監視してください。

ボイスモード準備完了!

ハンズフリーでAIアシスタントと会話を始めましょう。