155小时唇形同步视频数据_多模态

155小时唇形同步视频数据_多模态

训练数据集

计算机视觉训练数据集

语音识别训练数据集

语音合成训练数据集

OCR训练数据集

发音词典训练数据集

自然语言理解训练数据集

大模型训练数据集

训练数据集

数据堂现有成品训练数据集涵盖语音识别数据20万小时，计算机视觉数据800TB，自然语言理解…
查看更多
数据定制服务

3D点云数据定制

街景数据定制

OCR数据定制

行为识别数据定制

身份识别数据定制

语音识别数据定制

语音合成数据定制

多模态数据定制

数据定制服务

数据堂拥有专业数据采集设备、工具和环境，自建三大数据标注基地，凭借丰富的AI数据项目实施经验及完善的项目管理流程，满足客户多种场景和类型的数据需求，支持专业个性化数据采集与标注服务。
查看更多
行业解决方案

智能驾驶解决方案

智能娱乐解决方案

智能客服解决方案

智能家居解决方案

新零售解决方案

智能医疗解决方案

行业解决方案

数据堂拥有10年以上为各行各业提供数据服务的经验。
查看更多
数据标注平台

数据标注平台

数据标注实训平台
关心数据堂

企业介绍

人才招募

新闻中心

数据竞赛

咨询销售

客服
留言
联系电话 13051623904
电话
发送邮件 services@datatang.com
邮件

cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功！感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

996

_AI数据集产品_数据堂

155小时唇形同步视频数据_多模态_155小时唇形同步视频数据_多模态

155小时唇形同步视频数据_多模态

经授权许可的成品数据集助力快速启动AI项目

249人参与录制语音以及相匹配的唇语视频，多设备同步录制，通过脉冲信号进行精准对齐，准确性高。可用于语音图像领域的多模态学习算法研究。经多家AI公司验证：有助于模型面对真实世界的多样性时能够表现出色。我们严格遵循数据保护法规和隐私规定，确保数据采集、存储和使用的过程中维护用户的隐私和合法权益，所有数据均遵循GDPR, CCPA, PIPL。

购买咨询获取样例

数据规格

格式: 视频mp4格式，1,280*720；音频wav格式，16kHz 16bit单声道

录制环境: 阳面带窗的安静室内模拟室外白天驾驶场景；信噪比15~20dB

录制场景: 根据光照强度分为不同大场景和子场景

录制内容: 短指令；口语句子

录音人: 249名中国人，其中男性125人，女性124人

录制设备: 摄像机、高保真麦克风、声卡

录制角度: 同时录制正脸、单一面侧脸、俯视、仰视、侧脸俯视、侧脸仰视6个角度的视频（含音视频），以及近端、远端2个距离的音频（不含视频）

语言: 普通话

应用场景: 唇语识别

准确率: 句准确率95%

样例展示

已获被采集人明确授权且高质量的成品训练数据集助您快速启动AI项目

相关数据推荐

531小时车载噪音数据（麦克风+手机）

531小时车载噪音数据（麦克风+手机）

245小时中国普通话语音数据_车载环境朗读（手机）

245小时中国普通话语音数据_车载环境朗读（手机）

更高质量的数据更有竞争力的AI

训练数据集: 计算机视觉训练数据集; 语音识别训练数据集; 语音合成训练数据集; OCR训练数据集; 发音词典训练数据集; 自然语言理解训练数据集; 大模型训练数据集

数据定制服务: 3D点云数据定制; 街景数据定制; OCR数据定制; 行为识别数据定制; 身份识别数据定制; 语音识别数据定制; 语音合成数据定制; 多模态数据定制

行业解决方案: 智能驾驶解决方案; 智能娱乐解决方案; 智能客服解决方案; 智能家居解决方案; 新零售解决方案; 智能医疗解决方案

数据标注平台: 数据标注平台; 数据标注实训平台

资源中心: 数据标注工程; 助研数据集; 高质量数据要求

友情链接: openMPD; 数加加; Datatang.jp; Datatang.ai; 帕依提提

联系我们: 13051623904; services@datatang.com

网站地图法律声明与隐私权益

Copyright © 2023 DATATANG 数据堂（北京）科技股份有限公司
京ICP备11010828号京公网安备 11010802026079号

数据亮点

155小时唇形同步视频数据_多模态

*姓名：

*手机：

*公司名称：

*企业邮箱：

*需求：

155小时唇形同步视频数据_多模态