Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

Higgsfield AI MCP 指南:Claude 視覺內容工具
AI 工具

Higgsfield AI MCP 指南:Claude 視覺內容工具

Higgsfield AI 於 2026 年 4 月 30 日正式發布其 MCP 伺服器,成為第一個將電影級圖片與影片生成能力直接帶入 Claude 對話中的平台。你不必再為了提示詞研究使用 ChatGPT、為了圖片生成切換到 Midjourney、為了影片製作打開 Runway——現在所 …

GitHub520:使用更新 Hosts 快速存取 GitHub 的開源解決方案
開源

GitHub520:使用更新 Hosts 快速存取 GitHub 的開源解決方案

對於全球數百萬開發者來說,GitHub 是現代軟體開發的神經中樞。但在許多地區——特別是亞洲部分地區、中東和南美洲——存取 GitHub 可能是一種令人沮喪的體驗:頁面需要幾十秒才能載入、個人資料圖片和儲存庫頭像無法呈現、git clone 操作超時,而且發行版無法下載。GitHub520 …

ComfyUI-Copilot:由 AI 驅動的助手,實現自動化工作流程開發
AI

ComfyUI-Copilot:由 AI 驅動的助手,實現自動化工作流程開發

ComfyUI 已成為 Stable Diffusion 圖片生成領域主流的節點式介面,透過其視覺化程式設計範例提供了前所未有的靈活性。但這種靈活性伴隨著陡峭的學習曲線:構建即使是基本的工作流程也需要理解模型檢查點、VAE、CLIP 嵌入、取樣器、排程器、潛在空間以及它們之間錯綜複雜的連接 …

ChatTTS:專為自然對話設計的開源對話式文字轉語音模型
AI

ChatTTS:專為自然對話設計的開源對話式文字轉語音模型

文字轉語音技術在近年來取得了巨大進步,但合成語音與人類對話的自然節奏之間仍然存在著持續的差距。大多數 TTS 模型能產出清晰乾淨的語音,但聽起來明顯是人造的——發音完美,卻缺乏讓對話感覺真實的停頓、氣息聲、笑聲和音調變化。ChatTTS 直接針對這個差距,提供一個從頭開始為對話式語音而非旁 …

AudioGhost AI:使用 Meta SAM-Audio 的開源物件導向音訊分離工具
AI

AudioGhost AI:使用 Meta SAM-Audio 的開源物件導向音訊分離工具

幾十年來,要從混合錄音中分離出單一樂器,要不是需要原始錄音室的多軌音源,就是得有經驗豐富的音訊工程師進行繁複的頻譜編輯。AudioGhost AI 改寫了這項工作流程,它將 Meta 先進的 SAM-Audio 模型帶到桌面上,提供直觀的圖形介面,讓任何人都能只靠文字提示就完成聲音分離。

TAG