4,995张越南语OCR标注及转写数据

4,995张越南语OCR标注及转写数据包括自然场景图片258张,互联网图像2,553张,文本图像2,184张。在标注方面,行级内容:行级四边形框标注、行级内容转写;竖列内容:竖列四边形框标注、竖列内容转写。本套越南语OCR标注及转写数据可用于多种场景下的越南语识别、越南语拍照翻译等任务。

数据规格

数据规模
4,995张,包括自然场景图片258张,互联网图像2,553张,文本图像2,184张
采集环境
包括自然场景(牌匾、包装说明、小广告、菜单、海报等)、互联网图像(杂志封面、漫画封面等)、文本图像(文本文档等)
采集多样性
包括多种场景、多种角度、不同光照条件
采集设备
手机
采集角度
仰视、平视
数据格式
图像数据格式为.jpg,标注文档数据格式为.json
标注内容
行级四边形标注、行级内容转写;竖列四边形标注、竖列内容转写
准确率
四边形框顶点偏差不超过10个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%

样例展示