227小时西班牙语手机采集语音数据_朗读
西班牙语语音数据_朗读(手机),基于给定的脚本朗读并模拟录制,覆盖经济,娱乐,新闻,口语等多个领域,内容丰富。此数据集标注了文本内容、时间戳等多种属性,由352名来自西班牙、墨西哥、委内瑞拉等国的西班牙语母语人员参与录制,口音正宗,录音环境安静,文本经过人工校对,准确率高,为语音识别相关研究及应用提供了丰富的资源,经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR,CCPA,PIPL。
数据规格
格式
16kHz 16bit,未压缩wav,单声道
内容分类
娱乐;新闻;口语;经济;数字;字母
录音条件
相对安静的室内,无回声
录音设备
安卓手机:苹果手机=3.5:1
录音人信息
共计352人,来自西班牙、墨西哥、委内瑞拉等国家,其中男性占比55%,女性占比45%;
国家
西班牙,墨西哥,委内瑞拉等
语言
西班牙语
标注特点
标注文本内容、时间戳、5 种噪音符号、5 种标识符
准确率
句准确率95%
样例展示
0:00/ 0:00
0:00/ 0:00
Esta revolucionaria experiencia de compra se encuentra entre las primeras soluciones de este tipo para la televisión
0:00/ 0:00
0:00/ 0:00
mil despidos en sectores relacionados con la construcción en Castilla La Mancha y Castellón Comunidad valenciana
0:00/ 0:00
0:00/ 0:00
Esto cada día se parece más a la Cuba [/pre/] Fidel.
0:00/ 0:00
0:00/ 0:00
a los nacionales cualificados nos los quedamos,que este es su país
0:00/ 0:00
0:00/ 0:00
El despido libre sería lo mejor no % no soy empresario,soy trabajador