10,619张30种票据OCR数据

10,619张30种票据OCR数据采集背景为多种不同背景,数据包括30种票据、多个省份。在标注方面,标注行级四边形标注、行级内容转写。本套票据OCR数据可用于票据识别、文字识别等任务。

数据规格

数据规模
10,619张,30种
采集环境
多种不同背景
采集多样性
包括多种票据类别、多个省份
采集设备
手机
图像参数
图像格式为.jpg,标注格式为.json
标注内容
行级四边形标注、行级内容转写
准确率
四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%

样例展示