101人4,538张日语手写体OCR数据
101人4,538张日语手写体OCR数据文字载体为A4纸。该数据内容涵盖社会民生、娱乐、旅游、体育赛事、电影、作曲等领域。在标注方面,对文本进行字符级矩形框标注、字符级内容转写和行级矩形框标注、行级内容转写。本套数据可用于日语手写体OCR任务。
数据规格
数据规模
101人,4,538张
采集环境
A4纸
采集设备
扫描仪
拍摄角度
平视
数据格式
图像数据格式为.jpg,标注文档格式为.json
数据内容
涵盖社会民生、娱乐、旅游、体育赛事、电影、作曲等领域
标注内容
字符级矩形框标注、字符级内容转写;行级矩形框标注、行级内容转写
准确率
矩形框顶点偏差不超过3个像素为正确检测,检测框精度不低于97%;字符转写精度不低于97%
样例展示



