開源

AI May 02, 2026

Ultimate Vocal Remover GUI：由 AI 驅動的開源音訊源分離工具

從歌曲中移除人聲過去需要昂貴的 DAW 外掛程式、受過訓練的耳朵以及數小時的手動 EQ 工作。結果往往平庸——相位抵消偽影、模糊的器樂音軌，以及人聲的殘留部分。Ultimate Vocal Remover GUI (UVR) 透過將最先進的深度神經網路帶入音訊源分離，以一個免費、開源的套件 …

AI May 02, 2026

自大型語言模型出現以來，建立能夠推理——而不僅僅是模式匹配——的機器一直定義著人工智慧的前沿。雖然像 OpenAI 的 o1 系列這樣的專有系統已經展示了令人印象深刻的推理鏈，但開源社群一直期待著一個可比的替代方案。現在登場的是 Marco-o1：來自阿里巴巴 AIDC-AI …

AI May 02, 2026

終端機一直是開發者最強大的介面——快速、可腳本化且無干擾。但它也是最孤獨的。Aider 改變了這種情況，將 AI 配對程式設計師直接帶入您的命令列，結合了終端機開發的速度與最新語言模型的推理能力。由 Paul Gauthier 建立，Aider 已成長為現存最受歡迎的開源 AI 程式設計 …

開源 May 02, 2026

對於全球數百萬開發者來說，GitHub 是現代軟體開發的神經中樞。但在許多地區——特別是亞洲部分地區、中東和南美洲——存取 GitHub 可能是一種令人沮喪的體驗：頁面需要幾十秒才能載入、個人資料圖片和儲存庫頭像無法呈現、git clone 操作超時，而且發行版無法下載。GitHub520 …

AI May 02, 2026

ComfyUI 已成為 Stable Diffusion 圖片生成領域主流的節點式介面，透過其視覺化程式設計範例提供了前所未有的靈活性。但這種靈活性伴隨著陡峭的學習曲線：構建即使是基本的工作流程也需要理解模型檢查點、VAE、CLIP 嵌入、取樣器、排程器、潛在空間以及它們之間錯綜複雜的連接 …

AI May 02, 2026

文字轉語音技術在近年來取得了巨大進步，但合成語音與人類對話的自然節奏之間仍然存在著持續的差距。大多數 TTS 模型能產出清晰乾淨的語音，但聽起來明顯是人造的——發音完美，卻缺乏讓對話感覺真實的停頓、氣息聲、笑聲和音調變化。ChatTTS 直接針對這個差距，提供一個從頭開始為對話式語音而非旁 …