Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

AI 工具 May 02, 2026

Higgsfield AI MCP 指南：Claude 視覺內容工具

Higgsfield AI 於 2026 年 4 月 30 日正式發布其 MCP 伺服器，成為第一個將電影級圖片與影片生成能力直接帶入 Claude 對話中的平台。你不必再為了提示詞研究使用 ChatGPT、為了圖片生成切換到 Midjourney、為了影片製作打開 Runway——現在所 …

開源 May 02, 2026

對於全球數百萬開發者來說，GitHub 是現代軟體開發的神經中樞。但在許多地區——特別是亞洲部分地區、中東和南美洲——存取 GitHub 可能是一種令人沮喪的體驗：頁面需要幾十秒才能載入、個人資料圖片和儲存庫頭像無法呈現、git clone 操作超時，而且發行版無法下載。GitHub520 …

AI May 02, 2026

ComfyUI 已成為 Stable Diffusion 圖片生成領域主流的節點式介面，透過其視覺化程式設計範例提供了前所未有的靈活性。但這種靈活性伴隨著陡峭的學習曲線：構建即使是基本的工作流程也需要理解模型檢查點、VAE、CLIP 嵌入、取樣器、排程器、潛在空間以及它們之間錯綜複雜的連接 …

AI May 02, 2026

文字轉語音技術在近年來取得了巨大進步，但合成語音與人類對話的自然節奏之間仍然存在著持續的差距。大多數 TTS 模型能產出清晰乾淨的語音，但聽起來明顯是人造的——發音完美，卻缺乏讓對話感覺真實的停頓、氣息聲、笑聲和音調變化。ChatTTS 直接針對這個差距，提供一個從頭開始為對話式語音而非旁 …

AI May 02, 2026

幾十年來，要從混合錄音中分離出單一樂器，要不是需要原始錄音室的多軌音源，就是得有經驗豐富的音訊工程師進行繁複的頻譜編輯。AudioGhost AI 改寫了這項工作流程，它將 Meta 先進的 SAM-Audio 模型帶到桌面上，提供直觀的圖形介面，讓任何人都能只靠文字提示就完成聲音分離。

AI May 02, 2026

3D 創意領域正在經歷一場根本性的變革。幾十年來，建構 3D 場景需要掌握複雜的軟體、跨越陡峭的學習曲線，並投入無數時間進行手動素材放置和渲染。Intangible AI 這個專為空間智慧打造的生成式 AI 平台，正在徹底改寫這套規則。