Categories

音频

MLX-Audio:为 Apple Silicon 优化的 TTS、STT 和 STS 库
AI

MLX-Audio:为 Apple Silicon 优化的 TTS、STT 和 STS 库

配备 M 系列芯片——从 M1 到最新的 M4 Ultra——的 Apple Silicon Mac 拥有非凡的计算能力,特别是在机器学习工作负载方面。其统一内存架构允许模型访问大量快速内存,而无需传统 CPU-GPU 数据传输的瓶颈。MLX-Audio 是一个基于 Apple MLX 框 …

Ultimate Vocal Remover GUI:由 AI 驱动的开源音频源分离工具
AI

Ultimate Vocal Remover GUI:由 AI 驱动的开源音频源分离工具

从歌曲中移除人声过去需要昂贵的 DAW 插件、受过训练的耳朵以及数小时的手动 EQ 工作。结果往往平庸——相位抵消伪影、模糊的器乐音轨,以及人声的残留部分。Ultimate Vocal Remover GUI (UVR) 通过将最先进的深度神经网络带入音频源分离,以一个免费、开源的包彻底改 …

ChatTTS:专为自然对话设计的开源对话式文本转语音模型
AI

ChatTTS:专为自然对话设计的开源对话式文本转语音模型

文本转语音技术近年来取得了巨大进步,但合成语音与人类对话的自然节奏之间仍然存在着持续的差距。大多数 TTS 模型能产出清晰干净的语音,但听起来明显是人造的——发音完美,却缺乏让对话感觉真实的停顿、气息声、笑声和音调变化。ChatTTS 直接针对这个差距,提供一个从头开始为对话式语音而非旁白 …

AudioGhost AI:使用 Meta SAM-Audio 的开源面向对象音频分离工具
AI

AudioGhost AI:使用 Meta SAM-Audio 的开源面向对象音频分离工具

几十年来,要从混合录音中分离出单一乐器,要么需要原始录音室的多轨音源,要么得有经验丰富的音频工程师进行繁复的频谱编辑。AudioGhost AI 改写了这一工作流程,它将 Meta 先进的 SAM-Audio 模型带到桌面上,提供直观的图形界面,让任何人都能仅靠文本提示就完成声音分离。

TAG
CATEGORIES