983万组中日平行语料数据

983万组中日平行互译语料，数据存储格式为txt文档，包括通用、IT、新闻、专利、国际工程五个领域数据。已进行数据清洗脱敏质检，可作为文本类数据分析的基础语料库，用于机器翻译等领域。

数据堂如何保障数据质量与安全

数据规格

存储格式

TXT

数据内容

中日平行语料

数据规模

983万对中日平行语料数据

语言

汉语、日语

应用场景

机器翻译

准确率

90%

样例展示

客服

留言

微信

电话

邮件