Seed1.5-VL:字節跳動的視覺語言基礎模型,在 38 項基準測試中達到 SOTA
在快速發展的視覺語言模型領域,一個來自意想不到角落的新重量級選手出現了。由字節跳動 Seed 團隊開發的 Seed1.5-VL,在涵蓋影像理解、影片理解、文件解析和多影像推理的 60 個公開基準測試中,驚人地在 38 項中達到了業界最佳水準。
在快速發展的視覺語言模型領域,一個來自意想不到角落的新重量級選手出現了。由字節跳動 Seed 團隊開發的 Seed1.5-VL,在涵蓋影像理解、影片理解、文件解析和多影像推理的 60 個公開基準測試中,驚人地在 38 項中達到了業界最佳水準。