OpenClaw 白皮书
Deepgram(音频转录)
Deepgram 是一个语音转文字 API。在 OpenClaw 中,它通过
tools.media.audio 用于接收音频/语音消息的转录。启用后,OpenClaw 会将音频文件上传到 Deepgram,并将转录文本注入回复管道(
{{Transcript}} + [Audio] 块)。这不是流式处理;它使用的是预录音转录端点。快速开始
- ✦设置你的 API 密钥:
SHDEEPGRAM_API_KEY=dg_...
- ✦启用提供商:
json5{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3" }], }, }, }, }
选项
- ✦
model:Deepgram 模型 ID(默认:nova-3) - ✦
language:语言提示(可选) - ✦
tools.media.audio.providerOptions.deepgram.detect_language:启用语言检测(可选) - ✦
tools.media.audio.providerOptions.deepgram.punctuate:启用标点符号(可选) - ✦
tools.media.audio.providerOptions.deepgram.smart_format:启用智能格式化(可选)
带语言参数的示例:
json5{ tools: { media: { audio: { enabled: true, models: [{ provider: "deepgram", model: "nova-3", language: "en" }], }, }, }, }
带 Deepgram 选项的示例:
json5{ tools: { media: { audio: { enabled: true, providerOptions: { deepgram: { detect_language: true, punctuate: true, smart_format: true, }, }, models: [{ provider: "deepgram", model: "nova-3" }], }, }, }, }
注意事项
- ✦认证遵循标准提供商认证顺序;
DEEPGRAM_API_KEY是最简单的方式。 - ✦使用代理时,可通过
tools.media.audio.baseUrl和tools.media.audio.headers覆盖端点或请求头。 - ✦输出遵循与其他提供商相同的音频规则(大小限制、超时、转录文本注入)。