SAM-Audio:Meta 的音訊分割一切模型
分割一切模型(SAM)透過實現基於提示的影像中任意物體分割,徹底改變了電腦視覺。SAM-Audio 將同樣的變革性能力帶到音訊領域,允許使用者使用自然語言描述從混合音訊中隔離特定聲音。與其說「去除人聲」,不如說「提取背景中彈奏的民謠吉他」。
分割一切模型(SAM)透過實現基於提示的影像中任意物體分割,徹底改變了電腦視覺。SAM-Audio 將同樣的變革性能力帶到音訊領域,允許使用者使用自然語言描述從混合音訊中隔離特定聲音。與其說「去除人聲」,不如說「提取背景中彈奏的民謠吉他」。
幾十年來,要從混合錄音中分離出單一樂器,要不是需要原始錄音室的多軌音源,就是得有經驗豐富的音訊工程師進行繁複的頻譜編輯。AudioGhost AI 改寫了這項工作流程,它將 Meta 先進的 SAM-Audio 模型帶到桌面上,提供直觀的圖形介面,讓任何人都能只靠文字提示就完成聲音分離。