首页 理论教育 司法人工智能应用:极限与基线

司法人工智能应用:极限与基线

时间:2023-07-25 理论教育 版权反馈
【摘要】:虽然目前司法大数据的体量较为可观,但仍存在数据失真、维度单一、不够完备和结构化不足等问题,而条块式的管理体制机制也造就了“数据鸿沟”,致使司法大数据并不能体现为真正的“大数据”。且更大维度的数据发掘不应局限于法院系统,特别是在充分拓展司法的社会治理功能时,数据维度就要拓展到相关政府机构、社会组织等,但目前的数据管理呈现出条块化、部门化的特点,从而使得“数据鸿沟”难以较快地弥合。

司法人工智能应用:极限与基线

司法人工智能的开发在很大程度上取决于司法大数据数量和质量的情况,而司法大数据的真正形成又与法院信息化程度、司法公开的广度、力度紧密相关,更具体的层面则还涉及司法大数据的结构化等问题。

(一)法院信息化发展的不平衡不充分

司法大数据是以法院信息化的发展为前提的,在前期信息化1.0版(电子化)和2.0版(网格化)的进程中,法院信息化建设取得了长足进展和成效,各类司法信息依托各层级法院门户网站、庭审直播平台、审判流程公开平台、裁判文书网、执行信息公开平台形成了海量汇聚,但仍然存在以下两个层面的问题:一是发展的不充分。如全国各级人民法院的生效裁判文书陆续通过中国裁判文书网向社会公布并实时更新,广受社会好评,最高人民法院也通过专门文件明确了不上网公开裁判文书的种类范围,强化了不上网审批管理,但是,裁判文书公开仍然存在公开不全面、选择性公开等问题。根据中国社会科学院法学研究所对各地法院是否公开不上网裁判文书数量、案号和理由的第三方评估分析显示,全国法院中尚有2136家法院没有公示不上网裁判文书数量,占62.00%;1808家法院未公开不上网裁判文书的案号,占52.48%;1819家法院未公开不上网裁判文书的理由,占52.80%。[6]此外,司法过程的复杂性也决定了大量非电子化信息的存在,如大量手写的案件记录、副卷、实物证据、辩论信息难以电子化等。二是发展的不平衡。受经济条件、硬件设施和思想观念等各种因素的影响,各地法院信息化进程并不同步,特别是中西部法院信息化发展仍然较为滞后。仍以司法裁判文书的公开为例,一些研究指出:“有些省份如浙江、陕西、安徽公开文书量可以达到60%甚至70%以上,而有些省份如黑龙江、西藏要低于20%。”[7]随着裁判文书公开力度的进一步加强,这一现象得到了改观,但发展不平衡的问题依然存在。

(二)司法公开广度力度的不够

如前所述,真正的大数据是真实的、全样本、多维度的大数据(big data),而不仅仅是体量上的大数据。虽然目前司法大数据的体量较为可观,但仍存在数据失真、维度单一、不够完备和结构化不足等问题,而条块式的管理体制机制也造就了“数据鸿沟”,致使司法大数据并不能体现为真正的“大数据”。

从来源看,司法大数据包括上网的裁判文书、司法运行产生的数据和司法人、财、物管理产生的数据。然而,许多法院内部的数据特别是法院管理方面的数据并不公开,这至少限制了这一维度的分析——法院管理是如何影响司法公正或司法效率的。且更大维度(从而也就更有价值)的数据发掘不应局限于法院系统,特别是在充分拓展司法的社会治理功能时,数据维度就要拓展到相关政府机构、社会组织等,但目前的数据管理呈现出条块化、部门化的特点,从而使得“数据鸿沟”难以较快地弥合。(www.xing528.com)

此外,就最具直接价值也最受赞誉的裁判文书公开而言,其质效层面还有进一步提升的空间,这不仅仅是上文提到的应公开而不公开层面的问题,更关键的问题是,裁判文书公开维度、公开力度的缺失。在真实性方面,做到经信息化处理后的裁判文书和原裁判文书一致并不难,而真实性的相互对标并不限于此,更重要的是,裁判者的真实意思与裁判文书的表达是否一致。那些说理空泛粗暴、表达模糊不清的裁判文书实际上已从本体意义上“数据失真”了。在全样本方面,一些重要和关键的信息“隐藏”在庭审笔录、合议笔录中,并未系统化、结构化地呈现出来,而这些庭审笔录、合议笔录在目前又不能公开或不应公开,从而削弱了形成大数据的全样本基础。在多维度方面,裁判文书的地域性、短期性问题还比较突出(上海模式、贵州模式等是区域性的),缺乏全国范围内的、长历史跨度的裁判文书,从而限制了裁判规则一般性和发展逻辑的有效提炼和输出。

(三)司法数据库标准化建设不足

从司法数据库建设本身来看,需要统一的标准方可减少重复建设的成本,更利于数据的互联互通和后续的智能化处理。但目前标准化建设不足的问题较为突出,各地智慧法院建设“各自为政”,这既增加了学习成本,也导致了沟通衔接不畅等问题。如当事人网上立案在不同地方往往要使用不同的软件应用在使用方面的学习和操作、立案材料也不尽统一。诚如有学者所指出的:“假如存在复数法律知识数据库,如何使它们互相联系兼容并对它们进行排除矛盾和冲突的整合以及有效的一贯化控制,也是颇为棘手的重要课题,需要消耗大量的时间和精力才有望获得进展。”[8]

此外,还应认识到,法律数据库的建设是迭代发展的。这是由于随着社会的加速发展,法律规则的变动性也异常迅速,由此就提出了数据库及时更新的问题。从技术上看,仅仅实现法律规则的更新并不困难,问题在于对于法律规则具体理解和适用的差异,这集中体现在司法案例中。也就是说,案例库本身的有效性是要时时经受拷问的。有时候,为了应对不同的具体形势,阶段性、区域性的司法政策往往影响着司法裁判的尺度(如司法裁判对于国家限购政策的贯彻落实),更是增加了案例库建设的复杂度和难度。而且,这种细微的变化在整个网络体系中会被放大,从而形成更大的偏差。诚如学者所言:“何况法律在不断修改,知识数据库的更新以及解释规则的调整也需要不断进行,在网络结构中只要某一事项的重新定义出现过失,就有可能成倍放大误差、引起自动化处理的结果异常——这也将导致建构和维持电子计算机法律专家系统的成本居高不下。”[9]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈