
690万道中文多学科试题文本结构化解析处理数据

100万道中文代码试题文本结构化解析处理数据

3200万道理工科试题文本结构化解析处理数据

10万道逻辑推理试题文本结构化解析处理数据

14万道竞赛试题文本结构化解析处理数据

5,000张土耳其语自然场景OCR数据

52对双胞胎人脸采集数据

534小时台湾口音普通话自然对话手机采集语音数据

3,100万条东南亚语种新闻文本数据

335,000组东南亚语种多轮对话文本数据

302小时他加禄语手机采集朗读语音数据

822小时他加禄语手机采集朗读语音数据

30,696组人像精修前后图像数据

180人9,000张驾驶员手势21关键点标注数据

19小时公交场景噪音数据(录音笔)

1,000万道英文试题文本数据结构化解析处理数据

1.2亿条多编程语言代码数据集

209小时粤语语音数据_车载领域朗读(麦克风)

550万组土耳其语-英文平行语料数据

190小时法语游戏领域语音数据_口语化
. . .