Post

博客

SoloSoft 关于软件工程、Hugo、网站性能与多语言内容发布的技术文章。

AI 工具 May 02, 2026

Higgsfield AI MCP 指南：Claude 视觉内容工具

Higgsfield AI 于 2026 年 4 月 30 日正式发布其 MCP 服务器，成为第一个将电影级图片与视频生成能力直接带入 Claude 对话中的平台。你不必再为了提示词研究使用 ChatGPT、为了图片生成切换到 Midjourney、为了视频制作打开 Runway——现在所 …

开源 May 02, 2026

对于全球数百万开发者来说，GitHub 是现代软件开发的中枢神经系统。但在许多地区——特别是亚洲部分地区、中东和南美洲——访问 GitHub 可能是一种令人沮丧的体验：页面需要几十秒才能加载、个人资料图片和仓库头像无法渲染、git clone 操作超时，而且发行版无法下载 …

AI May 02, 2026

ComfyUI 已成为 Stable Diffusion 图片生成领域主流的节点式界面，通过其可视化编程范式提供了前所未有的灵活性。但这种灵活性伴随着陡峭的学习曲线：构建即使是基本的工作流也需要理解模型检查点、VAE、CLIP 嵌入、采样器、调度器、潜在空间以及它们之间错综复杂的连接 …

AI May 02, 2026

文本转语音技术近年来取得了巨大进步，但合成语音与人类对话的自然节奏之间仍然存在着持续的差距。大多数 TTS 模型能产出清晰干净的语音，但听起来明显是人造的——发音完美，却缺乏让对话感觉真实的停顿、气息声、笑声和音调变化。ChatTTS 直接针对这个差距，提供一个从头开始为对话式语音而非旁白 …

AI May 02, 2026

几十年来，要从混合录音中分离出单一乐器，要么需要原始录音室的多轨音源，要么得有经验丰富的音频工程师进行繁复的频谱编辑。AudioGhost AI 改写了这一工作流程，它将 Meta 先进的 SAM-Audio 模型带到桌面上，提供直观的图形界面，让任何人都能仅靠文本提示就完成声音分离。

AI May 02, 2026

3D 创意领域正在经历一场根本性的变革。几十年来，构建 3D 场景需要掌握复杂的软件、跨越陡峭的学习曲线，并投入无数小时进行手动资源放置和渲染。Intangible AI 这个专为空间智能打造的生成式 AI 平台，正在彻底改写这套规则。