大模型视觉测评榜单出炉,Gemini遥遥领先,豆包冲进前三

温馨提示:本文更新于2025-12-31,某些文章具有时效性,若有错误或已失效,请在下方留言!

SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

s 53a1816a433045f1b873f7a606d7ee81
大模型视觉测评榜单出炉,Gemini遥遥领先,豆包冲进前三 3

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

s 1a84e7f3ce834dc5943b4ec10f4a6831
大模型视觉测评榜单出炉,Gemini遥遥领先,豆包冲进前三 4
恭喜你发现了宝藏导航!>>点此前往<<
本站资源大部分来源于网络,请勿商业运营,仅供学习和研究,请在下载后24小时内删除!!
获取更多优质资源 按Ctrl+D收藏我们
© 版权声明
THE END
请赞助我们续费服务器
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容