35小时有声读物文本拼音标注语音数据

有声读物文本拼音标注语音数据,由5名发音人参与录制,其中男性3人,女性2人,对语音内容做汉字和拼音标注,拼音标注声调。为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。

数据规格

格式
44.1kHz,16bit,wav,单声道
内容分类
有声读物,内容包含美文、小说、儿童故事等 5 类;小说类所占时长最多,达45%
录音环境
相对安静的环境
录音设备
麦克风
录音人信息
共 5 人;其中男性 3 人,女性 2 人
国家
中国
语言地区代码
zh-CN
语言
中文普通话
标注特点
汉字和拼音;拼音标注 6 个声调,儿化音在拼音后加上 r 表示
准确率
句准确率95%

样例展示

0:00/ 0:00
0:00/ 0:00

那种畅快,那种恣意,不禁让小秦羽很是神往。 nei4 zhong3 chang4 kuai4 nei4 zhong3 zi4 yi4 bu4 jin1 rang4 xiao3 qin2 yv3 hen3 shi4 shen2 wang3

0:00/ 0:00
0:00/ 0:00

秦羽回忆起自己的风伯伯。 qin2 yv3 hui2 yi4 qi3 zi4 ji3 de5 feng1 bo2 bo5

0:00/ 0:00
0:00/ 0:00

你要是想观察社会,就去看看微博。 ni3 yao4 shi4 xiang3 guan1 cha2 she4 hui4 jiu4 qv4 kan4 kan4 wei1 bo2

0:00/ 0:00
0:00/ 0:00

在经济建设方面,由于议员都是本地人,最了解各地发展实情。 zai4 jing1 ji4 jian4 she4 fang1 mian4 you2 yv2 yi4 yvan2 dou1 shi4 ben3 di4 ren2 zui4 liao6 jie3 ge4 di4 fa1 zhan3 shi2 qing2

0:00/ 0:00
0:00/ 0:00

想象自己也能飞着去旅行。 xiang3 xiang4 zi4 ji3 ye3 neng2 fei1 zhe5 qv4 lv3 xing2