Planning-with-Files:AI 編碼代理的持續性 Markdown 規劃技能
Planning-with-Files 是由 OthmanAdi 開發的創新開源專案,為 AI 編碼代理實作了一個基於 Markdown 的持續性規劃系統。靈感來自 Manus 的規劃方法,該專案使用結構化的 3 檔案系統,維護一份隨著 AI 代理處理任務而不斷演進的動態規劃文件。它既可作 …
Planning-with-Files 是由 OthmanAdi 開發的創新開源專案,為 AI 編碼代理實作了一個基於 Markdown 的持續性規劃系統。靈感來自 Manus 的規劃方法,該專案使用結構化的 3 檔案系統,維護一份隨著 AI 代理處理任務而不斷演進的動態規劃文件。它既可作 …
PaddleOCR 是百度基於 PaddlePaddle 深度學習框架的工業級超輕量光學字元辨識 (OCR) 工具包。作為 GitHub 上最受歡迎的開源 OCR 專案之一,PaddleOCR 已發展多個主要版本——目前包括用於文字偵測與辨識的 PP-OCRv5、用於全面文件解析的 …
OpenManus-RL 是一個位於強化學習與 LLM 代理系統交會點的開源研究專案,由 Ulab-UIUC(伊利諾大學香檳分校)與 MetaGPT 協作開發。該專案提供一個全面的框架,用於 LLM 基礎代理的強化學習調校,實作了 GRPO(群組相對策略最佳化)、監督式微調 (SFT) 以 …
OpenHands 是一個開源 AI 驅動的軟體開發平台,迅速成長至超過 71,000 個 GitHub 星星,重新定義了 AI 輔助編碼的可能性。前身為 OpenDevin,OpenHands 由 All-Hands-AI 開發,提供一個全面環境,讓 AI 代理可以自主編寫程式碼、除錯、 …
InternVL 是由上海人工智慧實驗室的 OpenGVLab 開發的一系列開源視覺語言基礎模型。InternVL 系列將視覺 Transformer 擴展至 60 億個參數,並逐步與大型語言模型對齊,建立統一架構,在多項多模態基準測試中達到 GPT-4o 等級的表現。旗艦模型 …
GPT-SoVITS 是由 RVC-Boss 開發的開源語音複製與文字轉語音系統,在 AI 音訊社群中引起轟動。該專案的突出能力是僅需 1 分鐘語音資料即可訓練令人信服的語音模型的少量樣本語音複製,而零樣本能力只需 5-10 秒的參考音訊。支援中文、英文、日文與韓文,GPT-SoVITS …