85万组英日平行语料数据

85万组英日平行互译语料,数据存储格式为txt文档,覆盖旅游、医药、日常、新闻等多个领域。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域

数据规格

存储格式
txt
数据内容
英日平行语料
数据规模
85万对英日平行语料数据,英文平均句长23个单词
语言
英语、日语
准确率
90%
应用场景
机器翻译

样例展示