Categories

開源軟體

Spec Kit:GitHub 的 OpenAPI 規格工具組
開源軟體

Spec Kit:GitHub 的 OpenAPI 規格工具組

API 的品質在編寫一行程式碼之前就已決定——在定義其合約的規格中。Spec Kit,GitHub 用於 OpenAPI 規格的開源工具組,將自動化規格驗證的規範引入 API 開發,幫助團隊捕捉不一致、執行慣例並從單一事實來源生成文件。

SAM-Audio:Meta 的音訊分割一切模型
AI

SAM-Audio:Meta 的音訊分割一切模型

分割一切模型(SAM)透過實現基於提示的影像中任意物體分割,徹底改變了電腦視覺。SAM-Audio 將同樣的變革性能力帶到音訊領域,允許使用者使用自然語言描述從混合音訊中隔離特定聲音。與其說「去除人聲」,不如說「提取背景中彈奏的民謠吉他」。

RAGFlow:用於文件理解的開源 RAG 引擎
AI

RAGFlow:用於文件理解的開源 RAG 引擎

檢索增強生成(RAG)已成為將 LLM 回應基於事實資料的標準架構,但大多數 RAG 實作有一個根本弱點:它們將文件視為無差別的文字,將其切成任意區塊,失去所有結構意義。RAGFlow 採用根本不同的方法,結合深度文件理解與基於 LLM 的生成,提供精確、附引用來源的答案。

MarkItDown:Microsoft 的通用文件轉 Markdown 轉換器
AI

MarkItDown:Microsoft 的通用文件轉 Markdown 轉換器

任何文件理解 AI 流程的第一步是將原始文件轉換為機器可讀的文字。這個看似簡單的任務充滿了挑戰:具有複雜佈局的 PDF、沒有可提取文字的掃描文件、帶有合併儲存格的 Excel 檔案、帶有嵌入圖片的 PowerPoint。MarkItDown,Microsoft 的開源文件轉換工具,正面應對 …

LocalAI:自託管 OpenAI API 相容推理伺服器
AI

LocalAI:自託管 OpenAI API 相容推理伺服器

在本地運行 AI 模型具有不可否認的優勢:完整的資料隱私、無 API 成本、離線操作以及對模型選擇和配置的完全控制。但用本地替代方案取代雲端 AI 服務通常需要拼湊不同的工具——一個用於 LLM,另一個用於圖像生成,第三個用於語音辨識。LocalAI 透過提供一個單一的 OpenAI …

llm.c:Karpathy 的極簡 C 語言 LLM 訓練實作
AI

llm.c:Karpathy 的極簡 C 語言 LLM 訓練實作

大多數處理大型語言模型的開發者和研究人員透過 PyTorch 或 Hugging Face Transformers 等高階框架與之互動。這些框架在優雅的 API 背後隱藏了巨大的複雜性,但同時也模糊了這些模型實際學習的基本機制。llm.c 撕開了這層抽象,提供了一個在純 C 中完整、可運 …

TAG