cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

996

_AI数据集产品_数据堂

155小时唇形同步视频数据_多模态_155小时唇形同步视频数据_多模态

155小时唇形同步视频数据_多模态

  • 经授权许可的成品数据集助力快速启动AI项目

249人参与录制语音以及相匹配的唇语视频,多设备同步录制,通过脉冲信号进行精准对齐,准确性高。可用于语音图像领域的多模态学习算法研究。经多家AI公司验证:有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR, CCPA, PIPL。

获取样例 购买咨询

数据规格

格式
视频mp4格式,1,280*720;音频wav格式,16kHz 16bit单声道
录制环境
阳面带窗的安静室内模拟室外白天驾驶场景;信噪比15~20dB
录制场景
根据光照强度分为不同大场景和子场景
录制内容
短指令;口语句子
录音人
249名中国人,其中男性125人,女性124人
录制设备
摄像机、高保真麦克风、声卡
录制角度
同时录制正脸、单一面侧脸、俯视、仰视、侧脸俯视、侧脸仰视6个角度的视频(含音视频),以及近端、远端2个距离的音频(不含视频)
语言
普通话
应用场景
唇语识别
准确率
句准确率95%

样例展示

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

立即开始

相关数据推荐

531小时车载噪音数据(麦克风+手机)
531小时车载噪音数据(麦克风+手机)
245小时中国普通话语音数据_车载环境朗读(手机)
245小时中国普通话语音数据_车载环境朗读(手机)

数据亮点

155小时唇形同步视频数据_多模态

*姓名:

*手机:

*公司名称:

*企业邮箱:

*需求:

155小时唇形同步视频数据_多模态