10万组多模态理解推理数据集 | 覆盖艺术、工程、医学等6大学科
本数据集提供超过10万组高质量、经专业人员质检的多模态理解与推理问答对,深度覆盖艺术、工程、医学等6大学科的专业图文场景(如图表、图纸分析)。专为提升大模型在复杂图文下的逻辑推理与知识应用能力而构建,严格遵循GDPR/CCPA/PIPL等数据合规标准。
数据规格
数据规模
103,975组
图片分辨率
图像总分辨率不低于1300像素
学科类别
分为艺术类、商科、理科、医学、历史类、工科、生物类
问答长度
提问长度不少于10个汉字,答案及解析长度不少于40个字
采集设备
手机,扫描仪
采集多样性
多种学科、多种图片类型、多类型问题
数据格式
.jpg,.png,.json