20,011张自然场景OCR描述数据
20,011张自然场景OCR描述数据,包含亚洲语系与欧洲语系,总计14种语言,采集环境包括商店牌匾、站牌、海报、路标等多种场景,含有多种拍摄角度。描述语言为英语,主要描述文字排列方式、文字内容,颜色等信息。
数据规格
数据规模
20,011张图片,20,011段描述
语种分布
亚洲语系:韩语、印尼语、马来语、越南语、泰语、中文、日语 欧洲语系:法语、德语、意大利语、葡萄牙语、俄语、西班牙语、英语
采集环境
包括商店牌匾、站牌、海报、路标、提示语等多种场景
采集多样性
包含14种语言、多种自然场景、多种拍摄角度
数据格式
图片格式为.jpg,文本格式为.txt
采集设备
手机、相机
描述语言
英语
文本长度
原则上为30~60个单词,通常包含3-5句话
主要描述内容
文字排列方式、文字内容、颜色、场景
准确率
正确标注的图像占比不低于97%
样例展示



