Categories

AI

Hermes Agent:Nous Research 的自我改進 AI 代理,支援 17 個平台
AI

Hermes Agent:Nous Research 的自我改進 AI 代理,支援 17 個平台

大多數 AI 代理是靜態的——它們的行為在部署時就由系統提示和模型權重固定下來。當它們遇到未曾設計過的新情況時會發生什麼?它們會失敗,然後開發者必須手動更新代理。Nous Research 的 Hermes Agent 採用了一種根本不同的方法:它從自己的經驗中學習,並隨時間自動改進自身行 …

GPTQModel:適用於 GPU 和 CPU 的生產級 LLM 量化工具包
AI

GPTQModel:適用於 GPU 和 CPU 的生產級 LLM 量化工具包

大型語言模型功能強大,但其體積使得部署成本高昂。一個 700 億參數的 16 位元精確度模型需要 140GB 的 GPU 記憶體——遠超單一消費級 GPU 的容量。量化是主要的解決方案:降低數值精確度以縮小記憶體佔用並加速推論。由 ModelCloud 開發的 GPTQModel 是一個生 …

LTX-2:Lightricks 開源 4K 音訊-影片基礎模型
AI

LTX-2:Lightricks 開源 4K 音訊-影片基礎模型

生成式 AI 的格局已被影像擴散模型以及最近的影片擴散模型所改變。但生成聽起來和看起來一樣好的影片一直是一個頑固的獨立問題——直到現在。LTX-2 完全改變了這個局面。 由 Lightricks(熱門創意工具 Facetune 和 LTX Studio 背後的公司)開發,LTX-2 是首個 …

LTX Desktop:開源 AI 影片編輯器與生成桌面應用程式
AI

LTX Desktop:開源 AI 影片編輯器與生成桌面應用程式

AI 影片生成研究與實用影片編輯工具之間的差距一直巨大。研究人員發布強大的模型,但將它們轉變為編輯者實際可以使用的精緻桌面應用程式需要數週的整合工作。LTX Desktop 就是為了彌補這個差距而建立的。 由 Lightricks 開發,LTX Desktop 是一款開源桌面應用程式,將 …

LayoutParser:用於文件影像分析的統一開源工具包
AI

LayoutParser:用於文件影像分析的統一開源工具包

如果你曾經嘗試從掃描的 PDF、歷史報紙檔案或一疊發票中提取結構化資訊,你就知道痛苦所在:每份文件看起來都不一樣,每個模型期望不同的輸入格式,每個 OCR 引擎以不同的座標系統輸出文字。LayoutParser 就是為了終結這種混亂而建立的。

BELLE:鏈家科技開源中文大型語言模型
AI

BELLE:鏈家科技開源中文大型語言模型

大型語言模型的世界多年來一直由以英語為中心的系統主導。雖然 GPT-4、Claude 和 LLaMA 等模型在英語中表現出色,但它們在中文方面的能力——以及開源替代方案的可用性——一直落後。BELLE(Be Everyone’s Large Language model …

TAG