
5,000张土耳其语自然场景OCR数据

52对双胞胎人脸采集数据

534小时台湾口音普通话自然对话手机采集语音数据

3,100万条东南亚语种新闻文本数据

335,000组东南亚语种多轮对话文本数据

180人9,000张驾驶员手势21关键点标注数据

19小时公交场景噪音数据(录音笔)

1,000万道英文试题文本数据结构化解析处理数据

1.2亿条多编程语言代码数据集

209小时粤语语音数据_车载领域朗读(麦克风)

550万组土耳其语-英文平行语料数据

190小时法语游戏领域语音数据_口语化

226小时法语金融领域实体标注口语化语音数据

217小时西班牙语金融领域实体标注语音数据_口语化

200小时巴西葡萄牙语金融领域实体标注语音数据_口语化

203小时德国德语金融领域实体标注语音数据_口语化

2人韩语平均音色合成库

14小时台湾普通话七风格平均音色合成库

105小时意大利意大利语游戏领域语音数据_口语化

300小时印度英语自然对话手机采集语音数据
. . .