語音辨識

AI May 05, 2026

FunClip：開源 AI 音訊剪輯與處理工具

音訊編輯通常需要手動檢查波形並進行精確剪裁，以隔離所需的片段。由 ModelScope 團隊開發的 FunClip 改變了這一點，它應用 AI 驅動的語音辨識和內容理解來自動化音訊剪輯任務。 FunClip 建構在 ModelScope 的 AI 模型生態系之上，能夠轉錄音訊、根據關鍵字或 …

AI May 05, 2026

影片剪輯是最耗時的創作工作之一，尤其是從談話類影片中剪掉靜音、失誤和填充詞的繁瑣過程。由 mli 建立的 AutoCut 透過 AI 驅動的管線解決了這個問題，它會自動分析音軌並移除人類剪輯師會剪掉的所有內容。該工具透過語音辨識處理影片檔案，識別含有意義語音的片段，並產出保持自然節奏的乾 …

AI May 04, 2026

OpenAI 的 Whisper 模型是自動語音辨識（ASR）領域的一項突破，證明了大規模弱監督訓練可以產出具有強大多語言轉錄能力的模型。然而，標準的 PyTorch 實作留下了顯著的效能提升空間。Faster-Whisper 由 SYSTRAN 開發，透過基於 CTranslate2 的 …

AI May 02, 2026

配備 M 系列晶片——從 M1 到最新的 M4 Ultra——的 Apple Silicon Mac 擁有非凡的運算能力，特別是在機器學習工作負載方面。其統一記憶體架構允許模型存取大量快速記憶體，而無需傳統 CPU-GPU 資料傳輸的瓶頸。MLX-Audio 是一個基於 Apple MLX …