智能音箱随处可见,但它们内建的语音助手通常缺乏现代 LLM 的智慧和灵活性。由 yihong0618 创建的 XiaoGPT 弥补了这个差距,它将小爱智能音箱直接连接到 ChatGPT,通过你现有的智能音箱硬件实现自然、智能的语音对话。
该项目通过拦截来自小爱音箱的音频流,将语音识别结果发送给 ChatGPT,并将 AI 的响应通过音箱播放回来。结果是一个智能音箱升级,保留了所有原始功能,同时增加了强大的 LLM 能力。
主要功能
| 功能 | 描述 |
|---|---|
| ChatGPT 集成 | 通过 ChatGPT 进行语音对话 |
| 小爱音箱支持 | 适用于小爱智能音箱 |
| 唤醒词检测 | 在自定义唤醒词上启动 |
| 连续对话 | 跨交互维护上下文 |
| 原始模式 | 切换回原生小爱助手 |
系统架构
flowchart LR
A[用户语音] --> B[小爱音箱]
B --> C[音频捕捉服务]
C --> D[语音识别<br/>ASR]
D --> E[LLM 请求<br/>ChatGPT / Claude]
E --> F[文本响应]
F --> G[文本转语音<br/>TTS]
G --> H[音频播放]
H --> B
I[唤醒词检测] --> C架构从智能音箱捕捉音频,使用 ASR 进行转录,将文本发送给 LLM 处理,将响应转换回语音,并通过音箱播放。唤醒词检测确保系统仅在被呼叫时启动。
支持的组件
| 组件 | 选项 | 备注 |
|---|---|---|
| 智能音箱 | 小爱(多种型号) | 中国市场最受欢迎 |
| LLM 后端 | ChatGPT、Claude 等 | 可配置 API 端点 |
| ASR 引擎 | 多种 | 内建或基于云端 |
| TTS 引擎 | 多种语音 | 可配置语音选择 |
| 唤醒词 | 可自定义 | 设置任何短语作为触发 |
设置选项
| 方法 | 难度 | 功能 | 维护 |
|---|---|---|---|
| Docker 部署 | 简单 | 完整堆栈,所有功能 | 低 |
| 手动安装 | 中等 | 可配置,模块化 | 中等 |
| Raspberry Pi | 困难 | 专用硬件,便携 | 中等 |
如需更多信息,请访问 XiaoGPT GitHub 仓库 和 小米 IoT 开发者文档。
常见问题
Q:我需要小爱音箱才能使用 XiaoGPT 吗? A:目前针对小爱音箱进行了优化,但架构可以适配其他智能音箱。
Q:XiaoGPT 需要云端服务吗? A:是的,它使用云端 ASR、LLM 和 TTS 服务来实现完整功能。
Q:我可以使用本地 LLM 代替 ChatGPT 吗? A:是的,系统支持用于本地或云端模型的可配置 API 端点。
Q:XiaoGPT 会破坏或禁用我原始的音箱功能吗? A:不会,原始功能被保留,你可以在模式之间切换。
Q:使用 XiaoGPT 需要中文吗? A:不需要,它通过 LLM 和 ASR 配置支持多种语言。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!