大模型训练数据集
计算机视觉训练数据集
语音识别训练数据集
语音合成训练数据集
OCR训练数据集
发音词典训练数据集
自然语言理解训练数据集
多模态数据定制
激光雷达点云数据定制
街景数据定制
OCR数据定制
行为识别数据定制
身份识别数据定制
语音识别数据定制
语音合成数据定制
高质量数据集建设解决方案
大模型解决方案
智能驾驶解决方案
智能娱乐解决方案
智能客服解决方案
智能家居解决方案
新零售解决方案
智能医疗解决方案
数据标注平台
数据标注实训平台
企业介绍
人才招募
新闻中心
数据竞赛
训练数据集
数据定制服务
行业解决方案
数据标注平台
关于我们
咨询销售
客户服务系统
首页
数据集聚合页
自然语言理解训练数据集
983万组中日平行语料数据
983万组中日平行语料数据
983万组中日平行互译语料,数据存储格式为txt文档,包括通用、IT、新闻、专利、国际工程五个领域数据。已进行数据清洗脱敏质检,可作为文本类数据分析的基础语料库,用于机器翻译等领域。
数据堂如何保障数据质量与安全
获取样例
购买咨询
数据规格
存储格式
TXT
数据内容
中日平行语料
数据规模
983万对中日平行语料数据
语言
汉语、日语
应用场景
机器翻译
准确率
90%
样例展示
客服
留言
微信
电话
邮件