本文档由英文原版机器翻译而成。如果翻译版本与英文原版之间存在任何冲突,请以英文原版为准。 阅读英文原版
语音:说与听
想让 AI 大声朗读响应吗?或者想口述消息而不是打字?Caiioo 提供语音输入和输出功能 —— 全部可配置,部分在您的设备本地运行。

语音输出(文本转语音)
让 AI 大声朗读其回复。选择如下:
| 选项 | 类型 | 质量 | 设置 |
|---|---|---|---|
| 浏览器语音 | 本地 | 基础 | 免费,无需设置 |
| Kokoro | 本地 | 高 | 免费,在您的设备上运行 |
| ElevenLabs | 云端 | 高级 | 添加您的 API 密钥 |
| Resemble.ai | 云端 | 卓越(语音克隆) | 添加您的 API 密钥 |
启用方法:
- 前往“设置 > 语音”
- 选择一个文本转语音选项
- 如果希望 AI 自动朗读,请开启“自动朗读回复”
- 根据需要调整播放速度
本地与云端: 浏览器语音和 Kokoro 永远不会将任何内容发送出您的设备。ElevenLabs 和 Resemble.ai 会将文本发送到其服务器(使用您的 API 密钥)以生成音频。详情请参阅 隐私与数据。
语音输入(语音转文字)
通过口述代替打字输入消息。点击输入框中的麦克风图标开始录音。Caiioo 会转录您说的话并将其放入消息栏中。
选择转录方式:
| 选项 | 类型 | 隐私 | 设置 |
|---|---|---|---|
| Whisper | 本地 | 完全私密 | FREE,在您的设备上运行 |
| 浏览器语音 | 本地 | 私密 | FREE,内置 |
| ElevenLabs | 云端 | 准确(适合非英语) | 添加您的 ElevenLabs API 密钥 |
Whisper 和浏览器语音将音频保留在本地 —— 不会发送到任何服务器。ElevenLabs 会将音频发送到其服务器进行转录(使用您的 API 密钥),并提供更高的准确度,尤其是对于非英语语言。
使用方法:
- 点击输入框中的麦克风图标
- 说出您的消息
- 完成后停止
- 转录内容出现在消息栏中
- 根据需要编辑,然后发送
全系统听写 (macOS)
macOS 上的 Pro 订阅用户还可以安装 PrivateVoice,这是一个独立的伴侣应用程序,它添加了一个全局“按下通话”热键,可以向任何应用程序(不仅是 Caiioo)进行听写。详情请参阅桌面版下载页面。
另请参阅
This guide is maintained by the Caiioo team using Slate, our built-in editor.