cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

年末促销 分秒交付 | 成品数据集冬日礼遇活动开始啦!

作者:数据堂 发布时间:2023-12-12

作为国内首家上市的人工智能数据服务企业,数据堂持续积累了20万小时语音数据集、800TB计算机视觉数据集、20亿条文本数据集等,数据质量经全球头部AI企业考验,成功助力客户提升AI模型性能。我们精心整理了热门成品数据集系列,适配智能语音、智能驾驶、智能客服、新零售等多场景智能化需求。

 

冬日礼遇活动期间,所有成品数据均享优惠,分秒即可交付!

 

对话语音系列成品数据集

Part.1 自然对话语音数据集

数据堂现有10万小时自然对话语音数据集,涵盖中文、英语、德语、俄语、意大利语、法语、西班牙语等100多个语种,没有预设语料,完全由发音人根据话题自由发挥,超越普通数据质量要求,可有效提高客户语音识别模型准确率。

 

信道多样化

采集设备种类繁多,格式涵盖8kHz16kHz及以上。

 

发音人年龄多样化

发音人均匀分布各个年龄阶段,涵盖儿童、青少年、中年、老年等。

 

语种多样化

发音人覆盖100多个国家与地区且数据满足当地口语话表达习惯。

 

 自然对话语音数据集-8kHz(点击放大查看哦)



自然对话语音数据集-16kHz及以上点击放大查看哦)


Part.2 客服语音数据集

数据堂现有2万小时客服语音数据集,涵盖英语、法语、德语、瑞典语等10多个语种,多种口音习惯及特点,内容覆盖多个领域,贴合真实客服场景习惯。

 

真实性高

数据堂通过专业采集设备还原客户与客服对话场景,通过电话录音系统录制,具备8kHz16bitwav等格式。数据真实性还原度极高。

 

领域多样性

语音包含客户呼入和客服呼出等场景,内容覆盖保险、电商、金融、房地产、医疗等全领域。

 

 

智能座舱系列成品数据集

座舱语音交互数据集

数据堂现有1万小时车载环境高质量语音数据集,涵盖多人种、导航、电话、车控等多个领域、侧脸、俯视、仰视、远近端等多个录制角度、音视频等多个模态,可为语音识别技术的优化提供非常好的帮助。

 

座舱视觉交互数据集

数据堂现有驾乘行为、手势识别、身份验证等多类型舱内视觉数据集,涵盖多个拍摄角度,可见光和红外双目等多个采集设备,均匀分布各个光照时间车型等采集类目。

 


Re-ID系列成品数据集

数据堂自有版权监控场景下Re-ID数据涵盖白种人、黑种人和黄种人,年龄分布不同年龄阶段,满足不同时间段、不同摄像头、不同人体朝向和姿态等数据多样性。

 

 

OCR系列成品数据集

数据堂现有200万张典型OCR数据集,内容涵盖多语种自然场景、会议PPT 、手写体、票据、试卷等OCR数据。采集设备多样,书写人员满足各国各地区手写习惯,涵盖各个类别数据内容。

 

OCR系列成品数据集语种分布


OCR系列成品数据集类型分布

FAQ-活动详情

活动时间:12.1-12.31

咨询电话:13051623904

联系邮箱:services@datatang.com

 

阅读更多内容
口音英语语音识别技术研讨会暨挑战赛-数据堂