MarkItDown:Microsoft 的通用文件轉 Markdown 轉換器
任何文件理解 AI 流程的第一步是將原始文件轉換為機器可讀的文字。這個看似簡單的任務充滿了挑戰:具有複雜佈局的 PDF、沒有可提取文字的掃描文件、帶有合併儲存格的 Excel 檔案、帶有嵌入圖片的 PowerPoint。MarkItDown,Microsoft 的開源文件轉換工具,正面應對 …
SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。
任何文件理解 AI 流程的第一步是將原始文件轉換為機器可讀的文字。這個看似簡單的任務充滿了挑戰:具有複雜佈局的 PDF、沒有可提取文字的掃描文件、帶有合併儲存格的 Excel 檔案、帶有嵌入圖片的 PowerPoint。MarkItDown,Microsoft 的開源文件轉換工具,正面應對 …
在本地運行 AI 模型具有不可否認的優勢:完整的資料隱私、無 API 成本、離線操作以及對模型選擇和配置的完全控制。但用本地替代方案取代雲端 AI 服務通常需要拼湊不同的工具——一個用於 LLM,另一個用於圖像生成,第三個用於語音辨識。LocalAI 透過提供一個單一的 OpenAI …
大多數處理大型語言模型的開發者和研究人員透過 PyTorch 或 Hugging Face Transformers 等高階框架與之互動。這些框架在優雅的 API 背後隱藏了巨大的複雜性,但同時也模糊了這些模型實際學習的基本機制。llm.c 撕開了這層抽象,提供了一個在純 C 中完整、可運 …
微調大型語言模型曾經是一個複雜、資源密集的過程,僅限於擁有大型 GPU 叢集的組織。LlamaFactory 使這項能力普及化,提供一個可存取的、功能豐富的框架,使在消費級硬體上微調數百種 LLM 架構變得實用。 由研究社群(hiyouga/LlamaFactory)創建,該框架已成長為最 …
在完全使用自己的硬體上運行強大的語言模型,無需將資料發送到雲端 API 的夢想,曾經被認為對於大型科技公司以外的任何人來說都是不切實際的。llama.cpp 打破了這個假設。這個單一標頭檔的 C++ 實作已成為在本地運行 LLM 最受歡迎的工具,在幾乎所有硬體配置上都實現了 AI 計算的普 …
第一代 LLM 代理遵循一個簡單、可預測的迴圈——思想、行動、觀察的 ReAct 模式。但現實世界的應用程式需要更複雜的編排:多個代理協同工作、條件分支、人類監督、跨複雜工作流程的持久狀態,以及迴圈回溯以進行改進的能力。LangGraph 提供了使這些模式成為可能的基於圖形的架構。