Post

博客

SoloSoft 关于软件工程、Hugo、网站性能与多语言内容发布的技术文章。

Higgsfield AI MCP 指南:Claude 视觉内容工具
AI 工具

Higgsfield AI MCP 指南:Claude 视觉内容工具

Higgsfield AI 于 2026 年 4 月 30 日正式发布其 MCP 服务器,成为第一个将电影级图片与视频生成能力直接带入 Claude 对话中的平台。你不必再为了提示词研究使用 ChatGPT、为了图片生成切换到 Midjourney、为了视频制作打开 Runway——现在所 …

GitHub520:使用更新 Hosts 快速访问 GitHub 的开源解决方案
开源

GitHub520:使用更新 Hosts 快速访问 GitHub 的开源解决方案

对于全球数百万开发者来说,GitHub 是现代软件开发的中枢神经系统。但在许多地区——特别是亚洲部分地区、中东和南美洲——访问 GitHub 可能是一种令人沮丧的体验:页面需要几十秒才能加载、个人资料图片和仓库头像无法渲染、git clone 操作超时,而且发行版无法下载 …

ComfyUI-Copilot:由 AI 驱动的助手,实现自动化工作流开发
AI

ComfyUI-Copilot:由 AI 驱动的助手,实现自动化工作流开发

ComfyUI 已成为 Stable Diffusion 图片生成领域主流的节点式界面,通过其可视化编程范式提供了前所未有的灵活性。但这种灵活性伴随着陡峭的学习曲线:构建即使是基本的工作流也需要理解模型检查点、VAE、CLIP 嵌入、采样器、调度器、潜在空间以及它们之间错综复杂的连接 …

ChatTTS:专为自然对话设计的开源对话式文本转语音模型
AI

ChatTTS:专为自然对话设计的开源对话式文本转语音模型

文本转语音技术近年来取得了巨大进步,但合成语音与人类对话的自然节奏之间仍然存在着持续的差距。大多数 TTS 模型能产出清晰干净的语音,但听起来明显是人造的——发音完美,却缺乏让对话感觉真实的停顿、气息声、笑声和音调变化。ChatTTS 直接针对这个差距,提供一个从头开始为对话式语音而非旁白 …

AudioGhost AI:使用 Meta SAM-Audio 的开源面向对象音频分离工具
AI

AudioGhost AI:使用 Meta SAM-Audio 的开源面向对象音频分离工具

几十年来,要从混合录音中分离出单一乐器,要么需要原始录音室的多轨音源,要么得有经验丰富的音频工程师进行繁复的频谱编辑。AudioGhost AI 改写了这一工作流程,它将 Meta 先进的 SAM-Audio 模型带到桌面上,提供直观的图形界面,让任何人都能仅靠文本提示就完成声音分离。

TAG
CATEGORIES