zh

口音英语语音识别技术研讨会暨挑战赛-数据堂

联合主办单位

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    中国计算机学会

    语音对话与听觉专业组

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    西北工业大学

    音频语音与语言处理研究组

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    西安高新产业技术开发区

    软件园发展中心

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    陕西鲲鹏生态创新中心

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    上海交通大学

    智能语音实验室

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    新加坡南洋理工大学

    计算机科学与工程学院

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    美国约翰霍普金斯大学

    语言与语音处理中心

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_联合主办单位

    数据堂(北京)

    科技股份有限公司

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_竞赛背景
  • 竞赛背景 CHALLENGE BACKGROUND

    INTERSPEECH2020 口音英语语音识别技术研讨会

    Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,2020年Interspeech以“Cognitive Intelligence for Speech Processing”为主题,汇聚来自全球语音领域的研究人员、人工智能从业者、业内知名企业等,在语音方面如信号处理和语音识别语言方面如NLP、翻译等进行深入交流与探讨。

    作为Interspeech2020的旗舰技术活动,口音英语语音识别技术国际研讨会计划于2020年10月25日在中国上海举行,旨在吸引全球范围内从事英语语音识别的研究人员。本次研讨会,数据堂将联合陕西鲲鹏生态创新中心、中国计算机学会语音对话与听觉专业组、西北工业大学音频语音与语言处理研究组共同筹办,同时发起口音英语语音识别挑战赛。本次研讨会也得到了西安市高新产业技术开发区软件园发展中心的大力支持。

  • 竞赛简介CHALLENGE INTRODUCTION

    口音英语语音识别挑战赛

    英文作为最具影响力的全球性交流语言之一,与其相关的英文语音识别系统也在学术界和工业界受到广泛关注。当前阶段,标准英文ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是口音英语识别仍然是具有挑战性的课题,商用系统往往通过大量的口音标注数据覆盖来缓解口音带来的识别性能影响。口音语音识别难点主要源于口音本身的不一致性、语速与音素发音的多变性难以建模等问题。另外,带有口音标注的语音数据的短缺也严重限制了相关研究的开展。

    Interspeech 2020口音英语语音识别挑战赛 (Interspeech2020 Accented English Speech Recognition, AESR) 向参赛者开放了来自不同国家的共八种口音英文数据,覆盖了各种发音特点、口音轻重,旨在加强英文语种识别、口音语音识别的研究交流。期待来自学术界与工业界的学术研究者能够相互切磋,有所收获。

    本次竞赛所使用计算资源由华为云提供

  • 口音英语语音识别技术研讨会暨挑战赛-数据堂_竞赛简介

赛道设置

Track1

口音种类识别

使用官方提供的各种口音英文的训练数据,训练语种分类模型。提交测试集合上的语种识别结果

注:对所使用的模型与训练技术不加限制,但不能使用任何官方数据集外的数据。评价指标为语种识别的准确率。
Track2

口音英语语音识别

使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。测试集合中会出现训练集外的口音以验证模型泛化性能

注:禁止使用包括ROVER在内的模型融合技术,音频训练数据限定为官方提供的共160小时口音英文数据,不允许使用音频数据对应的抄本之外的文本信息进行语言模型的训练。对语音数据的数据增广只能基于限定的数据。

指定数据

8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国、中国),每个国家20小时,总量160小时,由数据堂官方提供给参赛者。

时长

每种口音约20小时,共8种口音

语言与口音类型

来自俄罗斯、韩国、美国、葡萄牙、日本、印度、英国和中国的带口音的英文

说话人

每个语种40-110个说话人

音频格式

16kHz,16bit,单声道wav

录音环境

相对安静的室内,手机录音

音频内容

日常交流为主,包含人机交互等场景

训练数据将与按如下格式组织的metadata同时开放

字段

描述

SEX

说话人性别

AGE

说话人年龄

ACT

口音类别

MIT

录音设备

SCC

录音环境

LBR

音频时长

ORS

对应抄本

两个赛道中允许使用Librispeech数据 (http://www.openslr.org/12/

参赛日程

奖项设置

注:奖金金额均为税前金额

竞赛指导委员会

(排名不分先后)

谢磊

教授

西北工业大学

钱彦旻

副教授

上海交通大学

ShinjiWatanabe

副教授

美国约翰霍普金斯大学

ChngEngSiong

副教授

新加坡南洋理工大学

丰强泽

CTO

数据堂(北京)科技股份有限公司

参赛对象

面向全社会开放,高等院校、科研单位、互联网企业等人员均可报名参赛。

注:大赛主办和技术支持单位如有机会接触赛题背景业务、产品、数据的员工,则自动退出比赛,放弃参赛资格。

报名参赛与数据协议

  • 有意报名参赛的团队请联系interspeech2020@datatang.com
  • 下载注册信息表格(中文或英文)并填写相关信息,发送至上述地址,邮件主题:【口音英语竞赛-队伍名称】。需填写的信息内容包括组织名称和所选赛道。报名截止日期为2020年8月20日。
  • 组委会将在5个工作日内审核参赛队伍的参赛资格。通过审核的团队将签署挑战数据使用协议,并有资格加入挑战。
  • 训练数据将于2020年8月21日公布,数据下载方式将提供给通过审核并签署协议的参赛者。
下载报名表

反作弊声明

  • 参与者禁止提交多次报名,经发现将取消成绩并严肃处理。

  • 参与者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞、额外数据等不良途径提高成绩排名,经发现将取消成绩并严肃处理。

竞赛解释权归数据堂(北京)科技股份有限公司所有

数据解决方案

请填写姓名

手机格式错误!

请填写手机号码

请填写公司全称

请填写企业邮箱

需求描述不能为空!

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

需求最少输入5个字符!

暂无数据

Copyright datatang.com 数据堂(北京)科技股份有限公司 京ICP备11010828号 京公网安备 11010802026079号法律声明与隐私权政策

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

数据堂_datatang