1.4亿条中文裁判文书文本结构化解析处理数据

从1998年开始到2023年12月期间的1.4亿篇法律裁判文书,每篇裁判文书都进行了细粒度的结构化解析(数据格式为json,字段包括案件名称、法院名称、文书类型、案件类型、案由、当事人、裁判日期、构成文书内容的各个部分等,其中裁判文书全文内容解析为s22至s28),并提供了详细的数据字典说明文件。

数据规格

数据内容
裁判文书文本数据
数据规模
超1.4亿条
数据字段
包含案件名称、案号、案由、法院名称、全文、裁判日期等
存储格式
json
语言
中文
数据处理
对文书内容进行了细粒度的解析,进行了内容清洗

样例展示