zh

数据解决方案

请填写姓名

手机号码格式错误

请填写手机号码

请填写公司全称

请填写企业邮箱

需求描述不能为空

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

需求描述格式错误且最少输入5个字符

暂无数据

语音合成

首页>数据实验室>全部动态>口音英语识别能力评测,你的AI升级了吗?

口音英语识别能力评测,你的AI升级了吗?

来源:数据堂2021-09-09

据国外媒体报道,Vocalize.ai的实验室曾经对亚马逊的语音助手Alexa、苹果的语音助手Siri和谷歌的语音助手Google Assistant进行了一项语音识别能力测试。研究人员分别使用美国、印度、中国三个不同国家的口音英语对这三种语音助手进行了测试。来检测这些语音助手对口音英语的理解程度。


结果发现,Google Assistant在理解中国口音英语方面完全超过了其它两种语音助手。出现这种结果的主要原因是Google Assistant学习了中国口音英语数据而其他两种语音助手并没有学习。
作为一种国际通用语言,不同地区的英语口音存在较大差距是很正常的,有的地方英语口音大到听起来完全就是两种语言。如果AI不对不同地区的英语口音进行学习,很有可能闹出大乌龙。
无独有偶,去年印度空军就发现了从法国订购的“阵风”战斗机听不懂印度英语导致“阵风”的语音识别系统无法辨认印度飞行员的指令,甚至发生误判了。


印度“阵风”战斗机无法识别印度英语


最根本原因就是“阵风”战机的语音识别系统没有将各种不同语言和方言纳入数据库,在飞行过程中,飞行员很有可能因为发音不够标准,造成语音识别系统无法识别甚至误判。为了避免因为口音问题出现误判,现代战斗机的语音控制系统都必须经过长时间的调试、改进和升级,才能够满足需求。


当前阶段,标准英文ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是带有口音标注的语音数据的短缺严重限制了口音英语识别相关研究的开展
作为全球领先的人工智能数据服务服务商,数据堂已采集数十个国家和地区的口音英语数据集,能快速提高口音英语识别模型的识别精准度。



多国人口音英语数据集 


中国人口音英语数据集

3000余名名中国人参与录制的10万句常用英语句子,覆盖国内江苏、山东、北京、河南等方言区,符合中国人说英语的特定口音。录音文本涵盖常用英语句子,内容丰富,领域广泛,音素均衡。可用于改善语音识别系统对中国人说英语的识别效果。



美式英语口音数据集

近2000余名美国母语发音人参与录制,口音正宗。录音文本由语言专家参与设计,以交互场景为导向,涵盖交互、车载、家居、通用等多类别,内容丰富。文本经过人工校对,准确率高。



英式英语口音数据集

由1651名英国本土发音人参与录制,口音正宗。录音文本涵盖通用、交互、车载、家居等多类别,内容丰富。文本经过人工校对,准确率高。



德国人口音英语数据集

1000余名德国人参与录制,口音正宗。录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富。文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机。可用于语音识别、声纹识别模型训练、机器翻译语料库的建设或算法研究。



法国人口音英语数据集

1000余名法国人参与录制,音频内容包括通用、交互、车载、家居等多类别,内容丰富。覆盖18~60岁年龄段,在安静室内进行录制。可应用于语音识别、机器翻译等场景。



印度英语口音数据集

近2000余名印度本土发音人参与录制;录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别;文本经过人工校对,句准确率95%,可应用于语音识别、机器翻译、声纹识别。


数据堂已采集英国、美国、中国等数十个国家和地区的多国人口音英语数据,覆盖了各种发音特点、口音轻重,并完成对数据集的音标、重音标注、韵律标注,可以加强英文语种识别、口音语音识别的研究交流。


口音英语采集国家与地区分布


数据堂一直以最高标准要求自己,坚守并践行维护用户利益、保护数据安全、尊重用户隐私的承诺,已通过ISO27701、ISO27001隐私信息管理体系认证以及ISO9001质量管理体系认证,值得信赖。




如果以上数据不能满足您当前的需求,数据堂还可以针对特定人群、特定场景、特定语种提供相应的数据定制化服务,全力帮助客户得到满意的数据服务。



语音合成(TTS)_数据堂