5,147张日语手写体OCR数据
5,147张日语手写体OCR数据。文字载体为A4纸、横格纸、方格纸等。采集设备为手机,采集角度为平视视角。该数据内容涵盖日语作文、诗歌、散文、新闻、故事等领域。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于日语手写体OCR任务。
数据规格
数据规模
5,147张
人员分布
性别分布:男244人,女304人;年龄分布:18岁以下2人,18-45岁494人,46-60岁50人,60岁以上2人;国籍分布:日本
采集环境
普通A4纸、横格纸、方格纸等
采集设备
手机
采集角度
平视
数据格式
图像数据格式为.jpg,标注文档格式为.json
数据内容
日语作文、诗歌、散文、新闻、故事等
标注内容
行级四边形标注、行级内容转写
准确率
采集内容精度不低于97%; 文本转写精度不低于97%
样例展示



