智慧音箱隨處可見,但它們內建的語音助手通常缺乏現代 LLM 的智慧和靈活性。由 yihong0618 建立的 XiaoGPT 彌補了這個差距,它將小愛智慧音箱直接連接到 ChatGPT,透過你現有的智慧音箱硬體實現自然、智慧的語音對話。
該專案透過攔截來自小愛音箱的音訊串流,將語音辨識結果發送給 ChatGPT,並將 AI 的回應透過音箱播放回來。結果是一個智慧音箱升級,保留了所有原始功能,同時增加了強大的 LLM 能力。
主要功能
| 功能 | 描述 |
|---|---|
| ChatGPT 整合 | 透過 ChatGPT 進行語音對話 |
| 小愛音箱支援 | 適用於小愛智慧音箱 |
| 喚醒詞偵測 | 在自訂喚醒詞上啟動 |
| 連續對話 | 跨互動維護上下文 |
| 原始模式 | 切換回原生小愛助手 |
系統架構
flowchart LR
A[使用者語音] --> B[小愛音箱]
B --> C[音訊捕捉服務]
C --> D[語音辨識<br/>ASR]
D --> E[LLM 請求<br/>ChatGPT / Claude]
E --> F[文字回應]
F --> G[文字轉語音<br/>TTS]
G --> H[音訊播放]
H --> B
I[喚醒詞偵測] --> C架構從智慧音箱捕捉音訊,使用 ASR 進行轉錄,將文字發送給 LLM 處理,將回應轉換回語音,並透過音箱播放。喚醒詞偵測確保系統僅在被呼喚時啟動。
支援的元件
| 元件 | 選項 | 備註 |
|---|---|---|
| 智慧音箱 | 小愛(多種型號) | 中國市場最受歡迎 |
| LLM 後端 | ChatGPT、Claude 等 | 可配置 API 端點 |
| ASR 引擎 | 多種 | 內建或基於雲端 |
| TTS 引擎 | 多種語音 | 可配置語音選擇 |
| 喚醒詞 | 可自訂 | 設定任何短語作為觸發 |
設定選項
| 方法 | 難度 | 功能 | 維護 |
|---|---|---|---|
| Docker 部署 | 簡單 | 完整堆疊,所有功能 | 低 |
| 手動安裝 | 中等 | 可配置,模組化 | 中等 |
| Raspberry Pi | 困難 | 專用硬體,可攜帶 | 中等 |
如需更多資訊,請造訪 XiaoGPT GitHub 儲存庫 和 小米 IoT 開發者文件。
常見問題
Q:我需要小愛音箱才能使用 XiaoGPT 嗎? A:目前針對小愛音箱進行了最佳化,但架構可以適配其他智慧音箱。
Q:XiaoGPT 需要雲端服務嗎? A:是的,它使用雲端 ASR、LLM 和 TTS 服務來實現完整功能。
Q:我可以使用本地 LLM 代替 ChatGPT 嗎? A:是的,系統支援用於本地或雲端模型的可配置 API 端點。
Q:XiaoGPT 會破壞或停用我原始的音箱功能嗎? A:不會,原始功能被保留,你可以在模式之間切換。
Q:使用 XiaoGPT 需要中文嗎? A:不需要,它透過 LLM 和 ASR 配置支援多種語言。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!