Categories

开源

TinyZero:用不到 30 美元重现 DeepSeek R1-Zero 的强化学习推理
AI

TinyZero:用不到 30 美元重现 DeepSeek R1-Zero 的强化学习推理

DeepSeek R1-Zero 在 2025 年 1 月发布时被广泛认为是一项突破。该模型证明了纯粹的强化学习——无需任何人类推理示例的监督式微调——就能产生高级思维链推理、自我修正,甚至令人惊讶的「啊哈时刻」,模型在对话中途独立发现了更好的推理策略。但问题在于:训练基础设施被认为需要大 …

Linly-Talker:开源数字虚拟人物对话系统
AI

Linly-Talker:开源数字虚拟人物对话系统

能够进行自然对话的数字虚拟人物——看到你的脸、听到你的声音、以同步的唇部动作和表情回应——几十年来一直是科幻小说的主要元素。到了 2026 年,它已成为一个可以在你自己的硬件上运行的开源项目。 Linly-Talker 是由 Kedreamix 团队开发的全面开源数字虚拟人物对话系统。它将 …

IndexTTS-vLLM:使用 vLLM 推理加速的开源文本转语音
AI

IndexTTS-vLLM:使用 vLLM 推理加速的开源文本转语音

IndexTTS-vLLM 是 IndexTTS 文本转语音系统的加速版本,将模型的推理流水线移植到 vLLM 上运行——vLLM 是原本为大型语言模型服务开发的高性能推理引擎。结果是 TTS 推理速度提升 2.5-3.5 倍,在消费级 GPU 上实现了具有零样本语音克隆和多角色音频混合的 …

BetterShot:内置编辑器的开源 macOS 屏幕捕获工具
开源

BetterShot:内置编辑器的开源 macOS 屏幕捕获工具

对 macOS 用户来说,内置的屏幕捕获工具一直功能充足但受限。Apple 提供的功能(自 macOS Mojave 以来的屏幕截图快捷键)与高级用户所需的功能(标注、背景、快速编辑)之间的差距,一直由 CleanShot X(29 美元以上)和 Skitch 等商业工具填补。到了 …

StoryDiffusion:用于长序列图像与视频生成的一致性自注意力机制
AI

StoryDiffusion:用于长序列图像与视频生成的一致性自注意力机制

StoryDiffusion 是南开大学与字节跳动的一项研究项目,针对生成式 AI 中最困难的问题之一:在长序列图像与视频中维持视觉一致性。作为一项重要的研究贡献,它引入了一种新颖的**一致性自注意力(CSA)**机制,使扩散模型能够生成连贯的漫画条、动画和视频——全部无需微调或逐序列训练 …

TAG
CATEGORIES