跳到主要内容

语音输入

Claude Code 支持语音输入(src/voice/,5 文件),让用户可以通过说话与 Claude 交互。

启用语音

settings.json 中配置:

{
"voiceEnabled": true
}

语音处理流程

用户说话

音频采集

语音转文本 (Speech-to-Text)

关键词提取

转为文本输入

正常的消息处理流程

关键词提取

voice/ 模块包含关键词提取逻辑,能够从语音中识别:

  • 斜杠命令(如 "slash commit")
  • 文件路径
  • 代码标识符
  • 技术术语

实时流式处理

语音输入采用流式处理,支持:

  • 实时转写显示
  • 中间结果更新
  • 说话结束自动提交
  • 噪音过滤

使用场景

  • 代码审查时口述反馈
  • 快速描述需求
  • 长文本输入(比打字快)
  • 手不方便时操作