SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。
谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。
此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。
榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。
![图片[1]-大模型视觉测评榜单出炉,Gemini遥遥领先,豆包冲进前三-好软猫](https://img1.mydrivers.com/img/20251231/s_53a1816a433045f1b873f7a606d7ee81.png)
国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。
百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。
国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。
![图片[2]-大模型视觉测评榜单出炉,Gemini遥遥领先,豆包冲进前三-好软猫](https://img1.mydrivers.com/img/20251231/s_1a84e7f3ce834dc5943b4ec10f4a6831.png)
获取更多优质资源 按Ctrl+D收藏我们
© 版权声明
1 如果您喜欢本站
点击这儿
赞助本站,感谢支持!
2 帮助传送: 下载说明 | 会员权益 | 广告合作
3 转载注明:
4 本站内容大部分源于网络,请自行甄别
5 商业用途请联系原作者授权,若本站侵犯了您的权益请 联系我们:haoruanmao@qq.com 进行删除处理
6 本站大部分内容来源于网络,仅供学习与参考,严禁从事违法、侵权等任何非法活动,否则后果自负
2 帮助传送: 下载说明 | 会员权益 | 广告合作
3 转载注明:
4 本站内容大部分源于网络,请自行甄别
5 商业用途请联系原作者授权,若本站侵犯了您的权益请 联系我们:haoruanmao@qq.com 进行删除处理
6 本站大部分内容来源于网络,仅供学习与参考,严禁从事违法、侵权等任何非法活动,否则后果自负
THE END


























![表情[ciya]-好软猫](https://www.haoruanmao.com/wp-content/themes/zibll/img/smilies/ciya.gif)


暂无评论内容