70,303组多国国风图文描述数据

70,303组多国国风图文描述数据包含了书法画作、节日、服饰、乐器等多种类别,对每张图像进行了描述,此数据可为多模态大模型提供丰富的资源,经过多家AI公司的验证,此数据有助于模型在真实世界的应用中表现出色。在数据采集、存储和使用的过程中,我们始终严格遵循数据保护和隐私法规,确保用户的隐私和合法权益得到维护。所有数据均符合GDPR、CCPA和PIPL等法规要求。

数据规格

数据规模
70,303组
涵盖国家
西班牙、葡萄牙、意大利、法国、德国、日本、韩国
图片类型
包括但不限于地标建筑、手工艺品、饮食、书法画作、节日、服饰、乐器等
图像分辨率
图像总像素不低于200万
数据格式
图片格式为.jpg或png,文本格式为.txt
描述语言
中文及对应国家语言
文本长度
原则上中文文本长度为25-60字,对应语种为20-60词
准确率
标点间隔即为一句,正确标注的句子占比不低于 95%