nanoChat:Karpathy 的极简 LLM 聊天界面
现代 AI 聊天界面是工程的奇迹,但其复杂性可能掩盖了使它们运作的基本机制。nanoChat(GitHub 上的 karpathy/nanochat)是 Andrej Karpathy 刻意进行的极简主义练习——一个足够简单让开发人员可以在一次阅读中读懂并理解的 LLM 聊天界面。
现代 AI 聊天界面是工程的奇迹,但其复杂性可能掩盖了使它们运作的基本机制。nanoChat(GitHub 上的 karpathy/nanochat)是 Andrej Karpathy 刻意进行的极简主义练习——一个足够简单让开发人员可以在一次阅读中读懂并理解的 LLM 聊天界面。
科学研究过程以劳动密集而闻名,文献回顾、实验设计和验证往往耗费数月时间才能产生任何新贡献。AutoResearch(GitHub 上的 karpathy/autoresearch)是 Andrej Karpathy 对加速这个过程的愿景,通过一个 AI 驱动的研究助理,能够自主阅读论文、执 …
llm.c 提供了一个在纯 C 中完整、可运行的 GPT-2 训练实现。 graph LR A[输入文本\n已分词] --> B[嵌入层\nToken + 位置嵌入] B --> C[Transformer 块 x12\n自注意力 + FFN] C --> D[层归一化 …