大模型视觉测评榜单出炉，Gemini遥遥领先，豆包冲进前三 - 好软猫

大模型视觉测评榜单出炉，Gemini遥遥领先，豆包冲进前三

7个月前更新

03158

温馨提示：本文更新于2025-12-31，某些文章具有时效性，若有错误或已失效，请在下方留言！

SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先，字节跳动的豆包大模型以73.15分跻身前三，展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出，基础认知得分89.01、视觉推理82.82、视觉应用79.09，全面领先其他模型。

国内阵营中，商汤科技SenseNova V6.5 Pro以75.35分位居第二，字节跳动的豆包视觉版紧随其后，其基础认知得分82.70，甚至超过部分国际竞品，仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五，其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中，Anthropic的Claude-opus-4-5得分71.44，OpenAI的GPT-5.2(high)仅获69.16分，排名相对靠后。

文件有密码打不开？>>点此查看密码<<
恭喜你发现了宝藏导航！>>立即去挖宝<<

本站资源大部分来源于网络，请勿商业运营，仅供学习和研究，请在下载后24小时内删除！！

获取更多优质资源按Ctrl+D收藏我们

© 版权声明

1 如果您喜欢本站点击这儿赞助本站
2 帮助：下载说明 | 会员权益 | 广告合作
3 修改版本安卓及电脑软件，加群提示为修改者自留，非本站信息，注意鉴别；
4 本网站部分资源来源于网络，仅供大家学习与参考，请于下载后24小时内删除；
5 若作商业用途，请联系原作者授权，若本站侵犯了您的权益请联系站长进行删除处理；
6 如若转载，请注明文章出处：

THE END

新闻热点
# 豆包 # Gemini # SuperCLUE-VLM

请赞助我们续费服务器

96.66%的用户读了又读

评论抢沙发

请登录后发表评论

暂无评论内容