Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

Everyone Can Use English:開源 AI 驅動英語學習平台
開源專案

Everyone Can Use English:開源 AI 驅動英語學習平台

AI 與語言學習的交集代表了現代機器學習最有前景的應用之一。個人化輔導、即時發音回饋和上下文翻譯——這些在十年前還是科幻小說中的能力,現在在技術上已經可以實現。Everyone Can Use English 由 ZuodaoTech 開發,將這些能力整合到一個專為中文使用者學習英語而設計 …

Chat2Graph:以圖為本的多代理協作原生系統
AI

Chat2Graph:以圖為本的多代理協作原生系統

多代理 AI 範式已激發了開發者和研究者的想像力。這個願景引人入勝:專業代理協同工作,各自貢獻獨特的能力來解決單一代理無法單獨處理的複雜問題。但構建這樣的系統已被證明是困難的。代理之間的通訊、共享上下文、任務分解和推理可追溯性都帶來了嚴峻的工程挑戰。Chat2Graph 由 TuGraph …

Auto-Editor:開源自動影片編輯工具,透過靜音偵測進行剪輯
開源專案

Auto-Editor:開源自動影片編輯工具,透過靜音偵測進行剪輯

製作長片影片的內容創作者——教學、播客、講座、遊戲實況、訪談——都面臨一個共同的後製挑戰:移除空白片段。思考中的停頓、句子之間的靜默、猶豫以及場景之間的空檔時間都需要剪掉才能產出精緻的最終成品。手動編輯這些片段既繁瑣又耗時,而且容易出錯。

A2A:Google 的代理間通訊協定,現歸 Linux 基金會管轄
AI

A2A:Google 的代理間通訊協定,現歸 Linux 基金會管轄

AI 代理生態系統正在經歷一場寒武紀大爆發。用於構建代理的框架——LangChain、CrewAI、AutoGen、Semantic Kernel、Vertex AI Agent Builder——正在迅速增加,每個都有自己的內部通訊模式、資料格式和能力宣傳機制。這種碎片化造成了一個根本性 …

VoxCPM2:OpenBMB 免分詞器多語音合成模型
AI

VoxCPM2:OpenBMB 免分詞器多語音合成模型

VoxCPM2 是由 OpenBMB 開發的免分詞器文字轉語音 (TTS) 模型;OpenBMB 是隸屬於清華大學與北京人工智慧研究院 (BAAI) 的開源 AI 研究社群。VoxCPM2 擁有 20 億個參數,直接在連續語音表徵上運作,跳脫傳統需要離散音訊分詞器的框架,避免音質下降。

Verifiers:用於訓練 LLM 代理的模組化 RL 環境庫
AI

Verifiers:用於訓練 LLM 代理的模組化 RL 環境庫

Verifiers 是由 PrimeIntellect-ai 開發的模組化 Python 庫,提供一個全面框架,用於建立專為訓練 LLM 代理而設計的強化學習環境。專為從事基於 RL 的 LLM 對齊與代理最佳化的研究人員與實務工作者設計,Verifiers 提供一個乾淨、可組合的 …

TAG