Seed1.5-VL:字节跳动的视觉语言基础模型,在 38 项基准测试中达到 SOTA
在快速发展的视觉语言模型领域,一个来自意想不到角落的新重量级选手出现了。由字节跳动 Seed 团队开发的 Seed1.5-VL,在涵盖图像理解、视频理解、文档解析和多图像推理的 60 个公开基准测试中,惊人地在 38 项中达到了业界最佳水平。
在快速发展的视觉语言模型领域,一个来自意想不到角落的新重量级选手出现了。由字节跳动 Seed 团队开发的 Seed1.5-VL,在涵盖图像理解、视频理解、文档解析和多图像推理的 60 个公开基准测试中,惊人地在 38 项中达到了业界最佳水平。