CUDA

AI芯片 May 09, 2026

NVIDIA与Intel AI芯片战2026：投资人该如何选择

BLUF：NVIDIA 仍是 AI 芯片投资首选，Intel 转型路漫长 2026 年 AI 芯片战场上，NVIDIA 凭借 CUDA 生态、Blackwell 架构与超过千亿美元的预估营收，稳居霸主地位；Intel 虽借 18A 制程与 Gaudi 3 加速器展现转型企图，但执行面挑战重 …

AI May 05, 2026

Flash Linear Attention 通过提供线性复杂度替代方案，使 Transformer 模型能够处理比以前长数个数量级的序列。 graph LR subgraph 标准注意力 O(n^2) A1[Q: n x d] --> A2[K^T: d x n] A2 …

AI May 04, 2026

大型语言模型已经远远超出了消费级硬件的内存容量。一个 700 亿参数的模型在标准 16 位精度下需要 140 GB 的 GPU 内存——远远超过最昂贵的消费级 GPU。bitsandbytes 就是弥补这个差距的库，提供量化技术，使得在可负担的硬件上加载、训练和运行大型模型成为可能。

AI May 02, 2026

Transformer 架构已主宰深度学习多年，但一个新的挑战者已经出现：状态空间模型（SSM）。在最具影响力的 SSM 架构之一 Mamba 的核心，是一个名为 Causal-Conv1d 的、令人惊讶地简朴的 CUDA 内核库。由 Tri Dao（以 FlashAttention 闻名 …