cn
数据解决方案
请输入姓名
手机号码格式错误
请输入联系电话
请输入公司名称
请输入正确的工作邮箱
请输入数据需求
提交成功!感谢您支持数据堂。
填写格式错误请重新填写
确定
数据需求不能小于5个字且不能为纯数字
https://www.datatang.com
https://www.datatang.ai
m.datatang.ai
作者:数据堂 发布时间:2023-12-12
作为国内首家上市的人工智能数据服务企业,数据堂持续积累了20万小时语音数据集、800TB计算机视觉数据集、20亿条文本数据集等,数据质量经全球头部AI企业考验,成功助力客户提升AI模型性能。我们精心整理了热门成品数据集系列,适配智能语音、智能驾驶、智能客服、新零售等多场景智能化需求。
冬日礼遇活动期间,所有成品数据均享优惠,分秒即可交付!
数据堂现有10万小时自然对话语音数据集,涵盖中文、英语、德语、俄语、意大利语、法语、西班牙语等100多个语种,没有预设语料,完全由发音人根据话题自由发挥,超越普通数据质量要求,可有效提高客户语音识别模型准确率。
信道多样化
采集设备种类繁多,格式涵盖8kHz,16kHz及以上。
发音人年龄多样化
发音人均匀分布各个年龄阶段,涵盖儿童、青少年、中年、老年等。
语种多样化
发音人覆盖100多个国家与地区且数据满足当地口语话表达习惯。
自然对话语音数据集-8kHz(点击放大查看哦)
数据堂现有2万小时客服语音数据集,涵盖英语、法语、德语、瑞典语等10多个语种,多种口音习惯及特点,内容覆盖多个领域,贴合真实客服场景习惯。
真实性高
数据堂通过专业采集设备还原客户与客服对话场景,通过电话录音系统录制,具备8kHz,16bit,wav等格式。数据真实性还原度极高。
领域多样性
语音包含客户呼入和客服呼出等场景,内容覆盖保险、电商、金融、房地产、医疗等全领域。
数据堂现有1万小时车载环境高质量语音数据集,涵盖多人种、导航、电话、车控等多个领域、侧脸、俯视、仰视、远近端等多个录制角度、音视频等多个模态,可为语音识别技术的优化提供非常好的帮助。
数据堂现有驾乘行为、手势识别、身份验证等多类型舱内视觉数据集,涵盖多个拍摄角度,可见光和红外双目等多个采集设备,均匀分布各个光照时间车型等采集类目。
数据堂自有版权监控场景下Re-ID数据涵盖白种人、黑种人和黄种人,年龄分布不同年龄阶段,满足不同时间段、不同摄像头、不同人体朝向和姿态等数据多样性。
数据堂现有200万张典型OCR数据集,内容涵盖多语种自然场景、会议PPT 、手写体、票据、试卷等OCR数据。采集设备多样,书写人员满足各国各地区手写习惯,涵盖各个类别数据内容。
OCR系列成品数据集语种分布
OCR系列成品数据集类型分布
活动时间:12.1日-12.31日
咨询电话:13051623904
联系邮箱:services@datatang.com