查看原文
其他

左卫民:法律人工智能在中国的运用前景 | 人工智能与中国法律新时代

左卫民 中国法律评论 2024-02-05




2018年6月8日9时,人工智能与中国法律新时代论坛在北京大学法学院凯原楼成功举办。本次论坛由北京大学法律人工智能实验室/研究中心、法律出版社•《中国法律评论》、北京华宇软件股份有限公司、北大英华科技有限公司主办。本期推送此次论坛的部分精彩发言,以飨读者。

 

文章目录

於兴中:人工智能与法学研究新范式

周光权:大数据运用对于司法改革的意义与局限

左卫民:法律人工智能在中国的运用前景

刘楠:人工智能在司法领域的方向与瓶颈

米坤:法律智能科技助力法治中国建设


点击此处,即可回看论坛直播



左卫民

四川大学法学院院长,教授


  • 本文未经左老师审定,仅供学习参考。


非常高兴能够给我们在座的各位专家做这个交流。人工智能是非常火的话题,我就这个问题写了一篇文章,所以今天我谈谈我的看法。

 

一个整体的看法是什么呢,从来没有一个国家像中国这样去支持在司法和公共安全领域大规模的做AI的运营,这就说明在顶层设计方面,我们把AI应用于法律和公共安全领域的支持力度。在世界范围内,我们似乎没有见到像中国这样一种官方的大规模的支持。

 

比如说在美国,我们可以看到有一些运用,州法院系统把人工智能运用于去审前的保释,或者审后的假释制度,风险的预测,而且还发生了一些非常有名的官司,最近的一个官司还打到联邦最高法院,他们拒绝受理这个案件,联邦最高法院能不能介入这样其判断AI在司法中运用好还是不用好,联邦最高法院还没有充分的自信。

 

这个角度就可以看出,中国是在顶层设计方面重视。如果我们再深入分析,虽然中国的顶层设计很重视,你要到中国的司法实践中去看看我们的实践是怎么样的,我有一篇文章专门谈这个问题,我们可能就会发现,表面上是很热,实际上是很冷。

 

为什么?你去问法官,我在四川的一个基层法院,打开法院的内网,我说看看你们的智慧审判制度,法官用不用?不用,他们用的基本上都是区域很狭隘的系统,里面有非常少的案子,在那样一些案件你数据有限,案件有限,你怎么可能让我们的法官敢于去参考它。

 

我们在媒体上看到的,学术研讨会上我们看到的好像在大规模推进,在大规模应用,可能是不完全的现象,至少部分是不完全、不真实的。所以我们遇到的真正的问题是,大数据官方也很支持,但是现实生活中基本上不怎么用。这就是大的问题,为什么会出现我们国家的顶层设计官方投入很大,现实生活中应用不够的问题。国外是顶层设计不足,但是现实生活中利用得还相对来说可能多一些。

 

最近比较火的一篇文章,它分析了美国的司法数据库关于15万个假释案件的数据,然后再分析美国的法官在决定保释与否的问题上到底考虑什么因素,哪些因素会被过度强调,最后基于案例建了一个机器学习的模型,看人类法官第一考虑哪些因素,哪些因素最重要,第二哪些因素是对人类法官过度的考虑了,第三判断人类法官什么做错了,什么没做错。第四他认为自己做了一个正确的模型出来,把机器模型和人类模型的结果进行比较,人类法官的错误要比机器法官高20%,如果按机器法官判决的话,整个司法的正确率就会大幅度下降。

 

他们的结论就是算法能不能作为一个检察官,他们分析的新奥尔良地区的数据,1988到1998年的数据,他说算法如果得当的话可以做这样一个基本分析的工具。你就可以看出来,机器学习的深度使用,在司法领域中它是有效的,前提是你本身要有非常深厚的实证研究,不管是小数据的实证研究,大数据的实证研究,你能把它做得很好,你才可能做一些正确的东西,你才会发现人类法官的弱点,机器法官比人类法官更好的路径。

 

更不用说美国的知识产权裁判中间可以做裁判预测,因为知识产权相对规则比较清楚。我们刚才说到它应用得比较少,但是它运用比较深。

 

中国的问题是什么?我们的法学家不懂统计学,也不懂这样的机器学习,他自己不懂,他自己在学术研究就没办法做出那种国外的那种实证研究,很难写出来非常漂亮的文章。在这种情况下你要去搞法律AI,搞不出来的。

 

我们需要的是知识范式。我们现在在大数据应用方面,如果具体来说还有什么问题呢?第一个我觉得是数据的问题,中国的有些数据比国外好很多,全世界没有像中国这么大的裁判文书网,很多人都在研究中国的裁判文书,这就是我们非常好的数据库,基于这个数据库里可以做深度的文本挖掘,用统计学的方法,机器学习的方法,做回归分析,或者基于深度神经网络去做分析,这是可以做的,这也是老外很羡慕的。

 

我和一位教授聊天,他说一方面欧洲刚刚通过了数据保护的条例,就是没有数据保护条例,德国的法院裁判文书基本上不上网的,所以基本上没有数据,所以就他没办法做。而美国以刑事诉讼为例,85%根本不到法院去,绝大多数是陪审制,就是支持还是不支持,所以绝大多数是没有数据支撑的,真正有数据的就是最高法院的数据,现在报告预测最高法院。所以这是中国比他们好的,我们数据比他们多,更重要的是我们还有新的数据。

 

我们现在最新的数据,我们把电子文案档案电子化,我们的数据是非常丰富的,这是未来非常好的基础。我们现在的最大问题是过于依靠裁判文书,我们裁判文书有结构性的缺失,或者系统性的偏差。你基于裁判文书建模的话往往会出现问题,这个要高度警惕。

 

第二,裁判文书并不是中国最关键的一个司法决策的专业信息。我们通过裁判文书来获得信息,只是中国司法过程、司法决策的一部分,一部分可以公开的信息。所以这个决策信息对裁判文书过度依靠是有问题的。

 

还有更重要的是,中国的信息还有一个现象:实质信息与表面信息的差异性。我们可以公开的往往是表面信息,但是实质决策考虑的因素可能藏在大脑里面没有表达出来,也可能根据结果来写过程,根据自己的判断来论证这个判断。所以在这个情况之下,我们要依靠大数据,依靠有限的公开的信息,来获得一个对事物真实情况的充分认识,这样永远是有局限性的。所以在谈到中国的司法大数据和人工智能,我们必须要高度的警惕。

 

最本质的问题是算法。什么叫算法?

 

法学界有法学界的看法,计算学家有计算机学家的看法,数据科学家有数据科学家的定义,不管怎么样,我们今天说到算法,今天演示的是知识图谱。而把握世界的本质,它不是一个知识图谱的问题,它是一个统计学方法为基础的数据科学的问题。这个里面有回归分析,但是也有在回归分析之上、之外的深度学习、机器学习。

 

我最近在看一些文章,用机器学习来研究法律问题,完全不是法学的文章,你根本看不懂,在这样一个背景之下,我们法学界有真正的算法吗?实际上法学界基本上能运用到的东西都是通用的共性关键技术,他自己并没有针对法律的特殊性,去搞这样一套专门的算法,去统计、归纳司法的数据,这就是我们根本性的问题。

 

在这样的一个背景之下,我们的法律AI到底是什么?我们到底做了什么?建立什么样的模型?这个模型什么地方可以公开给我们看?算法是怎么算出来的?都没有。所以这个意义上,我们未来还有很远的路走。

 

我们现在要从基础抓起。比如,在四川大学法学院,我有一个统计学的博士,学科学数学,这样的学术背景,才可能从根本上改变法学院的基因,只有通过这种方式,真正的跨学科,打通式的学科研究,我们才可能迎来人工智能和大数据在中国法律中光辉灿烂的未来,谢谢!


相关阅读

李亢:人工智能会抢走就业岗位,还是创造就业机会?

江溯:自动驾驶汽车对传统法律体系造成哪些严重冲击?

李亚凝:从“无人机与汽车相撞”案谈起,在无人机时代,空域应当如何使用?

程金华:未来还未来,反思中国法律大数据的基础建设 | 中法评

李世阳:钓鱼软件侵犯他人财产案评析 | 互联网时代,刑法如何保护信息与信用?

高艳东:组织网购刷单案评析 | 信息时代非法经营罪的重生

周光权:国内首起“黄牛”抢购软件案评析 | 通过刑罚实现积极的一般预防

张欣:平台驱动型参与如何重构公共沟通?

张吉豫:人工智能如何养成?从法制建构的角度出发

鲁楠: 法治是否将会消亡,代之以代码之治? 

郑戈:如何用法律规制算法?如何用算法强化法律?

胡凌:人工智能时代,谁能控制赛博空间?

於兴中:必须警惕“人工智能万能论”,科技乌托邦不是人类的未来

李本(Benjamin L. Liebman):美国司法实践中的人工智能问题与挑战

王禄生:司法大数据与人工智能开发的技术障碍

赵志刚:检察智能化建设的三个关键

左卫民:如何通过人工智能实现类案类判?

吴汉东、张平、张晓津:人工智能对知识产权法律保护的六大挑战(下)

吴汉东、张平、张晓津:人工智能对知识产权法律保护的六大挑战(上)

继续滑动看下一个

左卫民:法律人工智能在中国的运用前景 | 人工智能与中国法律新时代

左卫民 中国法律评论
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存