98万组中文-乌尔都语平行语料数据

中文-乌尔都语平行语料数据包括98万组中文、乌尔都语平行互译语料,数据存储格式为txt文档。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。

数据规格

存储格式
txt
数据内容
中文与乌尔都语互译的平行语料对
数据规模
98万组中文-乌尔都语平行语料数据,中文平均句长19.9个字符
语言
中文、乌尔都语
准确率
90%
应用场景
机器翻译

样例展示