DeepSeek开源Janus-Pro-7B视觉多模态模型 打败DALL-E 3

时间: 2025-04-01 21:22:52 |   作者: 阳光房系列

  DeepSeek宣告开源全新的视觉多模态模型Janus-Pro-7B,在基准测验中打败了Stable Diffusion和OpenAI的DALL-E 3。该模型整合了优化的练习战略、扩展的练习数据和更大规划的扩展,取得了在多模态了解、文本到图画指令遵从才能方面明显发展,并增强了文本到图画生成稳定性。据悉,JanusFlow引进一种极简架构,能够直接在大型言语模型结构内进行练习而无需杂乱调整。这项作业代表着朝着更高效、更通用的视觉言语模型迈进了一步。

上一页