1,000张日语发票采集数据
1,000张日语发票采集数据。数据包含基础编辑500张,专业编辑500张。数据多样性包括不同发票内容、不同编辑类型、多种发票格式。发票上的公司名字、地址、姓名、传真号、电话等敏感信息均进行了虚拟化编辑,非真实信息。数据可用于日语发票检测、识别、端到端OCR等任务。
数据规格
数据规模
1,000张,其中基础编辑500张,专业编辑500张
采集多样性
不同发票内容、不同编辑类型、多种发票格式
采集设备
扫描仪
数据格式
数据按照2种格式进行存储,一种是pdf格式,一种是.jpg格式(pdf转换而来)
数据要求
发票上的公司名字、地址、姓名、传真号、电话等敏感信息均进行了虚拟化编辑,非真实信息
准确率
按照采集要求,采集准确率不低于95%
样例展示



