cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

告别“人工智障”:智能电视如何巧用场景化数据

作者:数据堂 发布时间:2023-03-30


“小T小T,我想点一份外卖”、“小T小T,去三亚的机票多少钱”,面对这些问题,小T都会像一个聪明的管家一样快速而精准地作出回应。

TCL V8全场景AI电视支持免遥控声控全场景AI,小T就是它的语音助手。用户除了可以用语音来控制电视播放不同的频道节目、调节音量,还能让“小T”进行地图导航、订机票、叫外卖等等。

智能家居作为AI落地的重要场景之一,得到了越来越多企业和研究机构的关注。而电视作为家居设备最重要的电器之一,多项人工智能技术在其中得到了集中体现,承载了智能家居的重要部分。



由于使用声音、手势进行控制不需要复杂的操作,使用图像识别就可以进行身份认证、实现个性化推荐,所以人机交互的便捷性和交互体验的准确流畅度成为消费者挑选智能电视的重要标准。

在这种背景下,图像识别和语音识别等技术成为智能电视不断升级的基础技术支撑。

数据堂自有版权的行业内高标准语音识别和图像识别训练数据深受重视和好评。在深刻理解智能家居场景的基础上,数据堂研制了人脸识别、声纹识别、表情识别等多种数据,为智能电视领域的技术创新和升级提供助力。


身份认证和个性化推荐

随着人工智能发展的脚步,能够识别个体身份的声纹识别、人脸识别和活体检测技术逐渐应用到智能电视中。

 作为全球首款声纹识别人工智能电视,“聪明”的长虹Q5K可以根据声纹准确识别每一位家庭成员并辨别其喜好,根据不同的指令发送者推送不同节目。即便是发出错误语音指令,电视也可以实现最大程度的纠错检索,推送正确节目。


无独有偶,康佳电视在声纹识别的基础上,还融入了人脸识别技术。电视可以结合人脸识别的个人身份以及性别年龄分类属性,为用户提供个性化内容定制以及便利操控体验。

 电视“智能”地识别身份进而进行个性化推荐离不开数据的支持。数据堂对海量原始数据进行框选、提取、分类等一些列处理,将混杂数据转化为可供机器学习的专业数据,能够有效提升智能电视识别的准确性。

数据堂自有版权声纹识别和人脸识别数据

1

521人普通话声纹识别手机采集语音数据

2

10,000人中文数字串手机采集语音数据

3

50000+人脸识别数据

4

1066人活体检测数据



设备唤醒

语音唤醒的目的是让智能设备在休眠或锁屏状态下也能检测到用户的唤醒词,直接进入到等待指令状态,开启语音交互第一步。


TCL V8全场景AI电视的“小T”掌握了Handfree免唤醒语音黑科技,用户只需唤醒一次“小T”后,便可以进行多轮自然对话,无需再频繁的唤醒“小T”。

利用语音唤醒,智能电视不需要实时地处于工作状态,可以达到节省能耗的效果。



数据堂研制的《1,200人唤醒词麦克风采集语音数据》在专业录音棚内用高保真麦克风进行采集,是一套高质量的语音唤醒训练数据。

数据堂自有版权唤醒词数据

1200人唤醒词麦克风采集语音数据



智能交互

用户和智能电视的交互方式主要有两种,即手势交互和语音交互

语音交互包括搜索节目、调台、改变音量度、改变亮度等。

通常人们会以非常自然方式给出指令,在这种情况下,方言、中英混读、重口音普通话对机器语音识别的准确性带来挑战。开发方言、中英混读、重口音普通话的语音数据成为提高机器识别率的核心方法

TCL V8全场景AI电视就加入了对四川话、河南话、陕西话、广东话、东北话的支持,让全国各地的消费者都能体验到人工智能带来的便捷。


此外,由于人机距离较远,对智能电视的远场语音识别能力也提出了更高的要求。由于混响、噪音等技术难题,远场识别的准确率要低于近场。因此,远场语音识别技术的提高需要有针对性的远场语音数据。


数据堂自有版权语音识别数据

1

3500小时中文普通话语音识别数据

2

10000+小时中文方言语音识别数据

3

1800小时中文重口音普通话语音识别数据

4

1800小时中英混读语音识别数据

5

998人远场家居手机麦克风阵列采集语音数据


用户进行换台、暂停、改变音量等操作,也可通过手势对智能电视进行无接触控制。

挥动手掌完成换台、通过双手的收和放来对界面进行放大和缩小,三星智能电视可以通过高清摄像头捕捉使用者的手势动作,从而支持用户对电视进行远程操控。


静态手势识别技术是目前落地效果最好的,但是动态手势识别技术可以识别区分度较小的手势,容错性也更强,因此向动态手势识别过渡已经成为一种趋势。


数据堂自有版权手势识别数据

1

314,178张18种手势识别数据

2

559,460段50种动态手势识别数据


情绪分析

通过对用户的面部表情以及视线关注度进行分析,智能电视可以判断出主人是否对节目感兴趣并及时进行个性化推荐


目前,表情识别和情绪分析已经逐渐在智能教育、智能驾驶等领域落地应用,搭载表情识别和情绪分析功能的智能电视也指日可待。


长虹在智能电视方向上做出了明确的规划,接下来将重点发展情绪分析、声纹识别、人脸识别等多项交互创新技术,推出人工智能电视新品。


实现这一目标需要人工智能根据大数据和深度学习的不断优化和升级,这中间自然离不开表情识别和情绪分析训练数据的支持。


数据堂自有版权表情识别数据

1

26,129人多人种7种表情识别数据

2

1,003人情感视频数据


从整体看来,目前智能电视整体处于初级的发展阶段,并不一定算真正意义上的“智能”电视。若想提高消费者对智能电视的认可度,首先要解决的就是人机交互的流畅性,而核心解决办法正是AI训练数据。

但可以肯定的是,未来搭载更多、更成熟AI技术的智能电视将更加人性化,助力打造更完美的智能生活。




语音合成(TTS)_数据堂