【1,505小时 中文普通话语音数据集】数据时长1505小时,是数据堂中文普通话语音数据库中的一部分。采集区域覆盖全国34个省级行政区域,参与录音人数达6408人,录音内容超30万条口语化句子。经过专业语音校对人员转写标注,并通过严格质量检验,句标注准确率达98%以上,是行业内句准确率的最高标准。(仅支持学术研究,未经允许禁止商用)
格式 | 16kHz 16bit,wav,单声道 | ||||||||||||||||||||||||||||||
录音环境 | 安静的室内,噪音不影响语音识别 | ||||||||||||||||||||||||||||||
录音内容 | 30万条口语化句子 | ||||||||||||||||||||||||||||||
录音人员 |
6,408 人 男性 2,999 人,女性 3,301 人 ≤20 岁 1,481 人,21~30 岁 4,412 人,31~40 岁 244 人,40 岁以上 163 人 录音人员分布于广东、福建、山东、江苏、北京、湖南、江西、香港、澳门等 34个省级行政区域 |
||||||||||||||||||||||||||||||
设备 | 安卓:iOS=9:1 | ||||||||||||||||||||||||||||||
语音 | 普通话;有口音的普通话 | ||||||||||||||||||||||||||||||
应用场景 | 语音识别 机器翻译 声纹识别 |
||||||||||||||||||||||||||||||
准确率 | 句标注准确率不低于98% | ||||||||||||||||||||||||||||||
使用效果 |
基于aidatatang_200zh数据集的语音识别模型训练效果,测评结果:
基于aidatatang_1,505zh数据集的语音识别模型训练效果,测评结果:
|
||||||||||||||||||||||||||||||
训练方法 |
基于aidatatang_200zh数据集的训练方法点击查看 (说明:aidatatang_200zh数据集是aidatatang_1,505zh数据集中的一部分) |
获取方式
开源数据【1,505小时 中文普通话语音数据】,我们提供以下获取方式:
提交成功!感谢您支持数据堂。
确定提交成功!下载《数据使用许可协议-数据堂-中文普通话语音数据》
确定并下载