影片剪輯是最耗時的創作工作之一,尤其是從談話類影片中剪掉靜音、失誤和填充詞的繁瑣過程。由 mli 建立的 AutoCut 透過 AI 驅動的管線解決了這個問題,它會自動分析音軌並移除人類剪輯師會剪掉的所有內容。
該工具透過語音辨識處理影片檔案,識別含有意義語音的片段,並產出保持自然節奏的乾淨剪輯。結果就是無需數小時手動時間軸工作即可獲得精美的影片。
核心功能
| 功能 | 描述 |
|---|---|
| 靜音移除 | 自動偵測並移除超過可設定閾值的停頓 |
| 填充詞偵測 | 識別「嗯」、「啊」和其他口頭填充詞以便移除 |
| 語音辨識 | 使用 Whisper 或其他 ASR 引擎進行準確轉錄 |
| 可設定閾值 | 調整靜音和填充詞移除的積極程度 |
| 批次處理 | 單次執行處理多個影片 |
剪輯管線
flowchart LR
A[原始影片] --> B[音訊提取]
B --> C[語音辨識<br/>Whisper]
C --> D[片段分析]
D --> E{靜音或填充詞?}
E -->|是| F[標記為移除]
E -->|否| G[保留片段]
F --> H[時間軸組裝]
G --> H
H --> I[匯出剪輯後的影片]管線從從原始影片中提取音訊開始。Whisper 轉錄語音,然後分析每個片段的靜音持續時間和填充詞存在情況。被標記的片段會被移除,其餘片段組裝成無縫的最終影片。
支援功能比較
| AutoCut | 手動剪輯(Premiere/DaVinci) | 其他 AI 工具 |
|---|---|---|
| 全自動 | 全手動 | 半自動 |
| 開源 | 昂貴的授權 | 通常為付費 |
| CLI 介面 | GUI 介面 | 混合 |
| Python 生態系 | 專有 | 通常封閉 |
| 可設定規則 | 手動決定 | 有限控制 |
實際應用
AutoCut 非常適合處理每週節目錄音的 Podcast 編輯、製作每日 YouTube 影片的內容創作者、錄製講座系列的教師,以及需要潤色內部影片的企業培訓團隊。節省的時間非常可觀——一段多次重錄的 30 分鐘錄音可以在幾分鐘內剪輯成乾淨的 15 分鐘最終版本。
如需更多資訊,請造訪 AutoCut GitHub 儲存庫 並探索驅動後端的 Whisper 語音辨識專案。
常見問題
Q:AutoCut 支援哪些影片格式? A:透過 FFmpeg 整合,支援常見格式如 MP4、MOV、AVI 和 MKV。
Q:我可以自訂靜音偵測閾值嗎? A:可以,你可以設定最小靜音持續時間(預設 0.5 秒)和信心水準。
Q:AutoCut 能處理多位說話者嗎? A:它可以處理多說話者音訊,但在單一主要說話者時效果最佳。
Q:我可以在匯出前預覽剪輯結果嗎? A:該工具支援產生編輯決策清單(EDL),可在其他編輯器中檢閱。
Q:它支援 GPU 加速嗎? A:是的,在有相容 GPU 的情況下,支援 Whisper 推論的 GPU 加速。
無程式碼也能輕鬆打造專業LINE官方帳號!一鍵導入模板,讓AI助你行銷加分!