您现在的位置是：首页 >科技 > 2025-01-20 16:19:07 来源：

MIT与DeepMind联袂揭示：视觉语言模型理解否定表达的困境及根源

导读视觉语言模型（VLMs）在多模态任务中至关重要，但理解否定表达仍是其重大挑战。现有模型如CLIP在处理否定陈述时表现不佳，根源在于预训练数

视觉语言模型（VLMs）在多模态任务中至关重要，但理解否定表达仍是其重大挑战。现有模型如CLIP在处理否定陈述时表现不佳，根源在于预训练数据主要由肯定示例构成，导致模型将否定与肯定视为同义。这在高风险领域如安全监控和医疗保健中尤为重要。

为解决此问题，MIT、DeepMind和牛津大学提出NegBench框架，用于评估和改进VLMs对否定的理解能力。该框架通过合成数据集提高模型训练和评估效果，显著提升了模型在处理否定查询时的召回率和多项选择任务中的准确率，为构建更强大的人工智能系统铺平了道路。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:张一鸣、王兴同乡廖杰远领衔，微医490亿独角兽冲刺港股IPO

下一篇:商汤科技发布SenseNova-5o大模型交互版，限时免费体验实时音视频对话服务

猜你喜欢

🌟解决Win10家庭版无法连接共享打印机问题💡

赫曼米勒 steelcase 冈村保友海沃氏，花了56146

解决windows系统80端口被占用问题 👨‍💻💡

October首页、文档和下载开源CMS 平台 🌐

黑莓8310图片、最新黑莓8310图片产品报价 📱✨

细说目标检测中的Anchors 📈小白学视觉的个人空间 📚

黑莓Q20哪个好综合对比 📱🔍

🎉 ThinkSAAS 2.1 版本开源社区发布下载 🚀

最新文章

汕头阳光水岸雅居楼盘详情

卡修斯在哪：探索神秘的踪迹

太子湾公园门票 | 春季赏花攻略

隋唐十八好汉排名 —— 根据勇猛与智谋的较量

海鲜的做法大全 —— 健康美味，轻松掌握

补水面膜用不用洗脸？揭秘保湿的秘密武器！

好用又便宜的手机 📱💰

领航员：探索未知的先锋

市政 —— 构建美好城市

名词所有格及其应用解析

冒险岛怀旧服官网

大连北站到星海广场

沈阳融创融公馆楼盘详情

剁椒做法 🍲——教你制作美味剁椒的秘诀

点击排行

热门推荐

随机推荐