14,511张英文手写体OCR数据

14,511张英文手写体OCR数据。文字载体为A4纸、横格纸、英文纸等。采集设备为手机,采集角度为平视视角。该数据内容涵盖英文作文、诗歌、散文、新闻、故事等领域。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于英文手写体OCR任务。

数据规格

数据规模
1,591人,14,511张
人员分布
性别分布:男659人,女932人;年龄分布:18岁以下30人,18-45岁1,479人,46-60岁82人
国籍分布
美国、菲律宾、印度、法国、埃及、巴基斯坦、津巴布韦等
采集环境
普通A4纸、横格纸、英文纸等
采集设备
手机
拍摄角度
平视
数据格式
图像数据格式为.jpg、.jpeg,标注文档格式为.json
数据内容
英文作文、诗歌、散文、新闻、故事等
标注内容
行级四边形标注、行级内容转写
准确率
采集内容精度不低于97%; 文本转写精度不低于97%

样例展示