2.5万人人物多风格视频数据
2.5万人人物多风格视频数据,包含2.5万人在不同场景下的多风格视频,人物肤色覆盖白/黄/棕/黑,年龄覆盖青年/中年/老年,视频分辨率不低于1920x1080,时长不低于10秒。该数据集可用于人物一致性视频生成、数字人生成等任务。
数据规格
数据内容
2.5万人,每人含1张正面照片和4-50段视频,其中视频包含以下4种类型中的至少3种:①正面、上半身面向镜头说话的视频;②肢体动作类视频;③人物与物品交互类视频;④人物与人物交互类视频
2.5万人,每人含1张正面照片和4-50段视频,其中视频包含以下4种类型中的至少3种:①正面、上半身面向镜头说话的视频;②肢体动作类视频;③人物与物品交互类视频;④人物与人物交互类视频
数据质量
①视频分辨率不低于1920x1080,时长不低于10秒;②每个人物的视频发生环境、背景、人物服饰等变化;③视频中人脸信息完整
数据分布
人物肤色覆盖white/yellow/brown/black,性别覆盖female/male,年龄覆盖young/middle-age/old-age等
数据标注
人物的肤色、性别和年龄段,及每段视频对应的类型