Categories

AI

AutoGen:Microsoft 的多代理對話框架
AI

AutoGen:Microsoft 的多代理對話框架

最複雜的問題很少由單獨工作的個人解決。它們需要協作——專家貢獻他們的專業知識、辯論方法、建立在彼此的工作之上,並迭代趨近解決方案。AutoGen,Microsoft 的多代理對話框架,將同樣的協作範式帶到了 AI 代理。

AudioCraft:Meta 的開源 AI 音訊生成工具組
AI

AudioCraft:Meta 的開源 AI 音訊生成工具組

從文字描述生成高品質音訊的能力長期以來一直是人工智慧的聖杯。AudioCraft,Meta 的開源 PyTorch 函式庫,透過一套涵蓋音樂、音效和神經音訊壓縮的全面音訊生成模型,將這項能力帶給了更廣泛的 AI 社群。 AudioCraft 在單一代碼庫中統一了三種不同的音訊生成能力:用於 …

X-R1:開源推理模型探索
AI

X-R1:開源推理模型探索

語言模型能夠透過強化學習——而無需人類示範——發展出複雜推理能力的這一發現,是 2024 年和 2025 年 AI 研究中最令人驚訝的結果之一。DeepSeek R1 表明,使用 RL 訓練的模型可以學會逐步思考,產生思維鏈推理,從而在數學、邏輯和程式設計任務上大幅提升表現。X-R1 是一 …

Surya:開源多語言 OCR 與文件理解系統
AI

Surya:開源多語言 OCR 與文件理解系統

光學字元辨識是電腦視覺最古老的應用之一,但傳統 OCR 引擎一直難以跟上現代需求。如今的文件在版面、多語言內容和品質變異性方面比以往任何時候都更加多樣化。Surya 代表了 OCR 的現代方法,建立在深度學習架構之上,以傳統引擎無法比擬的準確度處理真實世界文件的複雜性。

Oh My OpenAgent:開源多平台 AI 代理框架
AI

Oh My OpenAgent:開源多平台 AI 代理框架

AI 代理生態系統已經爆發式增長,各種框架提供了不同的抽象層、後端和功能。Oh My OpenAgent 以一個引人注目的主張進入這個領域:一個多平台代理框架,抽象了 LLM 提供者、部署目標和工具執行環境之間的差異,讓開發者專注於代理行為而非基礎設施佈線。

MCP Router:模型上下文協定伺服器的開源路由器
AI

MCP Router:模型上下文協定伺服器的開源路由器

模型上下文協定(MCP)已成為將 AI 代理連接到外部工具和資料來源的標準介面。隨著組織部署數十個 MCP 伺服器來處理從程式碼分析到資料庫查詢等任務,一個關鍵的基礎設施缺口已經出現:如何在不將每個代理與每個伺服器地址耦合的情況下,管理、路由和平衡跨多個 MCP 伺服器的流量?由 …

TAG