Post

部落格

SoloSoft 關於軟體工程、Hugo、網站效能與多語系內容發佈的技術文章。

Flash Linear Attention:Transformer 的高效注意力機制
AI

Flash Linear Attention:Transformer 的高效注意力機制

Transformer 架構自推出以來一直是序列處理的主導模型,但它有一個根本性的限制:自注意力機制的複雜度隨序列長度以 O(n^2) 增長。對於現代 AI 應用日益需要的長上下文——128K tokens、1M tokens 及以上——這個二次瓶頸變得難以負擔。Flash Linear …

FAISS:Meta 的高效相似性搜尋開源函式庫
AI

FAISS:Meta 的高效相似性搜尋開源函式庫

向量搜尋已成為現代 AI 系統的基礎技術。無論是在 RAG 流程中尋找相似文件、在電子商務目錄中匹配產品圖像,還是為推薦系統檢索相關嵌入,高效搜尋數十億向量至關重要。FAISS——Meta 的 Facebook AI 相似性搜尋函式庫——是這項任務的黃金標準。

Electron:使用 JavaScript 構建跨平台桌面應用程式
開源軟體

Electron:使用 JavaScript 構建跨平台桌面應用程式

桌面應用程式的格局已被一個簡單的洞察所改變:如果你能用驅動網際網路的相同 Web 技術來構建原生品質的桌面應用程式呢?Electron 將這個願景變為現實,並在此過程中成為現代桌面軟體開發的支柱。 Electron 是一個將 Chromium 的渲染引擎與 Node.js 執行時期相結合的 …

DPO:無需強化學習的 LLM 偏好直接最佳化
AI

DPO:無需強化學習的 LLM 偏好直接最佳化

在大型語言模型對齊的大部分歷史中,主導範式一直是基於人類回饋的強化學習(RLHF)——一個結合獎勵模型訓練與強化學習的複雜多階段流程。直接偏好最佳化(DPO) 以一個令人驚訝的簡單替代方案顛覆了這種方法:直接從偏好資料對齊語言模型,完全不需要任何強化學習。

Dify:開源 LLM 應用程式開發平台
AI

Dify:開源 LLM 應用程式開發平台

構建生產級 AI 應用程式需要的遠不止調用 LLM API。你需要文件處理流程、向量資料庫、提示管理、對話記憶、使用者認證、監控以及根據實際使用情況迭代應用程式行為的方法。Dify 在一個單一、整合的開源平台中提供了所有這些。

TAG