71,535张英文自然场景OCR数据
71,535张英文自然场景OCR数据采集场景为英国和美国实地采集。数据多样性包括多种场景、多种拍摄角度、多种光照条件。在标注方面,对英文OCR数据进行行级&单词级&字符级矩形框(或四边形框)标注,并对文本内容进行转写。本套英文自然场景OCR数据可用英文自然场景下的OCR任务。
数据规格
数据规模
71,535张图像,每张图像对应一份标注文档
采集环境
英国和美国实地采集,包括商店牌匾、海报、路标、提示语、警示语、包装说明、菜单、建筑物标志等
采集多样性
包括多种场景、多种拍摄角度、多种光照条件
采集设备
手机、相机、平板电脑
拍摄角度
仰视、俯视、平视
数据格式
图像数据格式为.jpg,标注文档格式为.json
标注内容
行级、单词级和字符级四边形框标注和内容转写
样例展示



