cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

1064

_AI数据集产品_数据堂

105,941张12种语言自然场景OCR数据_105,941张12种语言自然场景OCR数据

105,941张12种语言自然场景OCR数据

  • 经授权许可的成品数据集助力快速启动AI项目

105,941张12种语言自然场景OCR数据涵盖12种语言,包括6种亚洲语、6种欧洲语,采集覆盖多种自然场景、多种拍摄角度。在标注方面,标注行级文本的四边形框,行级文本转写。本套数据可用于多国语言OCR任务。

获取样例 购买咨询

数据规格

数据规模
105,941张,包括亚洲语系: 日语9,997张、韩语10,231张、印尼语7,591张、马来语5,650张、越南语8,822张、泰语9,645张;欧洲语系:法语10,015张、德语7,213张、意大利语8,824张、葡萄牙语7,754张、俄语10,376张、西班牙语9,823张
采集环境
包括商店牌匾、站牌、海报、车票、路标、漫画、井盖画、提示语、警示语、包装说明、菜单、建筑物标志等
采集多样性
包括12种语言、多种自然场景、多种拍摄角度(仰视、俯视、平视)
采集设备
手机、相机
图像参数
图像格式为.jpg, 标注格式为.json
标注内容
行级四边形标注、行级内容转写
准确率
四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于97%;文本转写精度不低于97%

样例展示

  • 105,941张12种语言自然场景OCR数据
  • 105,941张12种语言自然场景OCR数据
  • 105,941张12种语言自然场景OCR数据

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

14,980张8种语言PPT OCR数据
14,980张8种语言PPT OCR数据
3,506张印地语OCR标注及转写数据
3,506张印地语OCR标注及转写数据
4,995张越南语OCR标注及转写数据
4,995张越南语OCR标注及转写数据
262人5,162张繁体字(中国台湾)手写体OCR数据
262人5,162张繁体字(中国台湾)手写体OCR数据

数据亮点

105,941张12种语言自然场景OCR数据

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

105,941张12种语言自然场景OCR数据