智能车载语音消噪，噪音数据集必不可少！

作者：数据堂发布时间：2023-03-30

随着语音识别技术在智能车载领域落地应用越来越成熟，更多司机解放了双手，通过简单的语音指令就可以进行导航、听音乐、控制空调和车窗等设备。各大科技巨头纷纷发力车载语音助手市场，语音交互已然成为人车交互的重要趋势之一

以广汽传祺GS4为例，接入了腾讯生态车联网解决方案的广汽能够为用户提供语音控制导航、娱乐、车辆控制、系统控制、生活百科等47种生态化服务。车辆连接了腾讯丰富的内容服务生态，能够满足用户导航和驾驶时的内容和服务需求。

虽然作为新车标配的车载语音交互在近年来已经取得了长足的发展，但还有很多技术问题可以进行完善和提升，例如排除噪音影响的语音识别。实际上，智能车载场景中的语音识别会受到各种车内外噪音的干扰，如车内的音乐声、发动机声、空调声，车外的风声、车辆声等。

为了屏蔽噪音对车载语音识别的干扰，众多AI企业纷纷致力于训练数据的开发和技术的升级，研发出可以排除噪音影响的车载语音系统。即使是在车内外噪音嘈杂的环境中，车载语音系统也能准确识别用户的语音指令，广大司机不用再因为语音识别不够“聪明”而感到头痛。

此前，科大讯飞和奇瑞联合开发了一款深度定制语音技术的车载系统——Cloudrive2.0，搭载在奇瑞的新车艾瑞泽5车型上。讯飞使用了麦克风阵列定位人声，可以准确定位音源位置，即使汽车在高速行驶时，语音的识别率也能保证在 90% 以上。

Apollo作为百度面向汽车行业及自动驾驶领域的软件平台，其推出的车载语音系统配备了降噪阵列，即使是在高速路开窗大噪音场景下的语音识别准确率也非常高。

车载语音识别成功“去噪”的关键在于将大量车载语音数据用于AI模型训练。依靠数据的支持，机器能够准确识别噪音、捕捉用户语音指令，进而提升识别效率。

数据堂作为全球领先的人工智能数据服务提供商，研发了《531小时麦克风手机采集车载噪音数据》和《245小时车载环境普通话手机采集语音数据》，为提升车载语音交互质量提供助力。

531小时麦克风手机采集车载噪音数据

这套车载噪音数据的目的在于，将实际生活中可能遇到的各类车载噪音都采集全。

工作人员考虑了10款不同类型的主流车型，在车内副驾驶、中控台、中控台车机、后视镜等位置同时放置麦克风和手机，来录制不同天气、车窗开关状态、空调开关状态等各种环境条件下的纯噪音数据。

245小时车载环境普通话手机采集语音数据

这套数据是在车辆行驶中录制的人声，属于车载噪音环境下的朗读类语音库。

作为一个小规模的基础库，工作人员采集了245小时的语音数据。数据覆盖了各种车型，道路条件覆盖低速路和高速路，车内状态包括开关窗、开关音乐，句正确率高达95%。

数据堂在深刻理解智能驾驶场景的基础上，基于客户需求对海量原始数据进行框选、提取、分类等一系列处理，将混杂数据转化为机器学习可识别的车载语音专业数据，能够有效优化人机交互体验感，提升驾驶的安全性。

阅读更多内容

疫情期间，口罩在全国抗疫中起到了关键作用。但在口罩成为每一位公民“标配”的同时，对诸如“刷脸”支付、高铁闸机身份认证等需要人脸识别的场景提出了挑战。

根据百度的定义，距离机器大概有3米到5米的距离发出语音指令，就是远场语音识别。实际上，若没有特意靠近麦克风，处于一个自然说话、由远端麦克风拾音的状态下，通常就是远场语音识别的场景了。智能家居是重要的远场语音识别应用场景，智能远场语音是融合了AI语音搜素的一项改变用户体验的功能。