NVIDIA

AI May 05, 2026

NVIDIA Triton：多框架 AI 模型推論伺服器

Training machine learning models has become accessible to a broad audience of developers and organizations. Serving those models in production — …

AI May 03, 2026

能夠同時推理圖像和文字的視覺語言模型（VLM）已成為 AI 研究中最活躍的領域之一。由 NVIDIA Labs（NVlabs）開發的 VILA（視覺語言模型）代表了一個全面的開源 VLM 家族，專為多圖像推理、影片理解和視覺鏈式思考而設計。這些模型設計為可從邊緣裝置擴展到雲端部署，適用於機 …

AI May 03, 2026

將大型語言模型部署到生產環境中，不僅僅是將權重載入 GPU 而已。要達到可接受的吞吐量和延遲，您需要核心融合、注意力機制最佳化、記憶體管理和量化——所有這些都要針對您的特定硬體進行調整。NVIDIA 的 TensorRT-LLM 在一個開源函式庫中提供了所有這些功能，從 NVIDIA …

AI May 03, 2026

自主 AI 代理功能強大，但也伴隨著顯著的風險。具有 shell 存取權限的代理可能會意外刪除檔案、發送非預期的網路請求或洩露敏感資料。傳統的容器化技術（Docker、gVisor）並非為 AI 應用程式所需的細粒度、代理專屬安全政策而設計。NVIDIA OpenShell 以一個專為 …