103,975组多学科多模态理解推理数据

103,975组多学科多模态理解推理数据,涵盖艺术、工程、医学等6大学科、多个细分领域的专业级图文混合问题(如图表、工程图纸、艺术作品分析等),每个问题均由专业人员进行质检。该数据集将文本与视觉信息进行深度理解、可用于提升大模型的逻辑推理和知识应用的能力。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。

数据规格

数据规模
103,975组
图片分辨率
图像总分辨率不低于1300像素
学科类别
分为艺术类、商科、理科、医学、历史类、工科、生物类
问答长度
提问长度不少于10个汉字,答案及解析长度不少于40个字
采集设备
手机,扫描仪
采集多样性
多种学科、多种图片类型、多类型问题
数据格式
.jpg,.png,.json