WorldVQA WorldVQA是一个旨在衡量多模态大语言模型(MLLM)事实正确性的新基准。尽管最近发布的模型在视觉推理和描述方面展现出了令人印象深刻的能力,但衡量它们在视觉世界知识方面的可靠性仍然是一个挑战。020基准测试# Kimi# WorldVQA