5,000张土耳其语自然场景OCR数据
5,000张土耳其语自然场景OCR数据包括多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框和转写,多边形框标注和转写。本套数据可用于土耳其语言OCR任务。
数据规格
数据规模
5,000张,40,793框
采集环境
标语、小票、海报、警示语、路标、书籍、封面、站牌和招牌
采集多样性
多种自然场景、多种拍摄角度
采集设备
手机
拍摄角度
仰视、俯视、平视
数据格式
图像格式为.jpg等通用格式,标注文档格式为.json
标注内容
行级四边形标注、行级内容转写;多边形标注、内容转写
准确率
四边形框或多边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于95%; 文本转写精度不低于95%
样例展示



