Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

LayoutParser:用於文件影像分析的統一開源工具包
AI

LayoutParser:用於文件影像分析的統一開源工具包

如果你曾經嘗試從掃描的 PDF、歷史報紙檔案或一疊發票中提取結構化資訊,你就知道痛苦所在:每份文件看起來都不一樣,每個模型期望不同的輸入格式,每個 OCR 引擎以不同的座標系統輸出文字。LayoutParser 就是為了終結這種混亂而建立的。

BELLE:鏈家科技開源中文大型語言模型
AI

BELLE:鏈家科技開源中文大型語言模型

大型語言模型的世界多年來一直由以英語為中心的系統主導。雖然 GPT-4、Claude 和 LLaMA 等模型在英語中表現出色,但它們在中文方面的能力——以及開源替代方案的可用性——一直落後。BELLE(Be Everyone’s Large Language model …

3X-UI:用於 Xray-Core 代理伺服器管理的開源網頁面板
開源

3X-UI:用於 Xray-Core 代理伺服器管理的開源網頁面板

管理代理伺服器基礎設施傳統上一直是命令列的事情。手動編輯 JSON 設定檔、重新啟動服務、透過終端日誌監控流量——這可行,但遠非使用者友善。3X-UI 透過提供一個功能完整的網頁介面來管理 Xray-core 代理伺服器,改變了這一點。

TinyZero:用不到 30 美元重現 DeepSeek R1-Zero 的強化學習推理
AI

TinyZero:用不到 30 美元重現 DeepSeek R1-Zero 的強化學習推理

DeepSeek R1-Zero 在 2025 年 1 月發布時被廣泛認為是一項突破。該模型證明了純粹的強化學習——無需任何人類推理範例的監督式微調——就能產生高級思維鏈推理、自我修正,甚至令人驚訝的「啊哈時刻」,模型在對話中途獨立發現了更好的推理策略。但問題在於:訓練基礎設施被認為需要大 …

LMRouter:用於多供應商模型存取的開源 AI API 路由器
AI

LMRouter:用於多供應商模型存取的開源 AI API 路由器

AI 語言模型供應商的爆炸性成長為開發者帶來了矛盾的處境。一方面,多樣性非凡——OpenAI、Anthropic、Google、DeepSeek、Mistral、Groq 等數十家供應商每個月都在推進技術前沿。另一方面,每家供應商都有自己的 API 格式、認證機制、定價模式和速率限制。在單 …

Linly-Talker:開源數位虛擬人物對話系統
AI

Linly-Talker:開源數位虛擬人物對話系統

能夠進行自然對話的數位虛擬人物——看到你的臉、聽到你的聲音、以同步的唇部動作和表情回應——幾十年來一直是科幻小說的主要元素。到了 2026 年,它已成為一個可以在你自己的硬體上運行的開源專案。 Linly-Talker 是由 Kedreamix 團隊開發的全面開源數位虛擬人物對話系統。它將 …

TAG