中国人民大学法律数据分析挑战赛

Original RUCLAI 人大高瓴人工智能学院 2022-08-05

欢迎参加

第一届中国人民大学法律数据分析挑战赛

为促进人工智能、大数据等技术与人文社会学科的交叉融合，提升学生从事交叉学科研究的能力，培养学生的数据思维、计算思维，特组织第一届中国人民大学法律数据分析挑战赛。

此次挑战赛聚焦于使用大数据、数据分析、人工智能等基本技术手段来辅助法律问题分析的能力。参赛选手可针对特定问题，通过编写Python程序、利用人工智能、数据分析和可视化等工具软件，对法律数据进行分析和挖掘，以数据结果为依据开展法律问题研究，并撰写分析报告和论文。

挑战赛官网网址：

http://playbigdata.ruc.edu.cn/ruclai/

或通过点击“阅读原文”访问

大赛组织

主办单位

教务处、高瓴人工智能学院、法学院、

交叉科学研究院

协办单位

基于大数据文科综合训练国家级虚拟仿真实验教学中心

大会主席

黄文艺（法学院）、文继荣（高瓴人工智能学院）、吴健（教务处）、杨东（交叉科学研究院）

程序委员会主席

窦志成（高瓴人工智能学院）、

徐君（高瓴人工智能学院）、邓矜婷（法学院）

组织委员会主席

窦志成（高瓴人工智能学院）

组织委员会

刘品新（法学院）、张吉豫（未来法治研究院）、

邓矜婷（法学院）、沈蔚然（高瓴人工智能学院）、郑妍（高瓴人工智能学院）

宣传主席

郭歌扬（高瓴人工智能学院）

技术主席

徐炜（高瓴人工智能学院）

参赛要求

（1）要求作品图文并茂，凸显“数据”和“分析”的重要性，分析内容符合法学理论，避免仅针对个别案件进行个案分析。作品评选时会综合考虑方法的新颖性、分析的深度、问题的重要性、报告的规范性等几个方面。

（2）任选一道赛题参赛。

（3）中国人民大学本硕博学生均可以组队参加，每组成员不超过5人，鼓励文理交叉组队，每人限报名参加一支队伍，每支队伍可以聘请一位指导教师（可无）。

（4）竞赛提供的各种数据仅供参赛选手参加此次竞赛使用，不得私自用于其他用途，不允许私自转发和传播。

（5）鼓励参赛同学依托赛题开展小创、大创等科研项目训练。

作品要求

（1）获奖作品的知识产权归参赛队伍所有。

（2）要求提交论文（按模板撰写，要求不少于8000字），其中包含方法说明、数据处理、参考文献、使用的工具等信息。

（3）同时提交完成数据分析的相应程序、代码、脚本、结果等必要支撑文件。

（4）初选通过的同学，需要进行PPT讲解答辩。

作品提交

通过投稿系统在线提交，不接受邮件等其他方式提交。

奖项设置

根据参赛情况

每道赛题（或者整体）设置一、二、三等奖

颁发获奖证书及奖品

时间安排

任务发布日期：2022年8月1日

作品提交截止日期：2022年10月15日

评审日期：2022年10月15日-31日

汇报和颁奖活动：2022年11月15日（待定）

（所有时间安排以北京时间晚上24点为准，

组委会保留根据参赛情况调整时间安排的权利）

比赛题目

题目一：法条跟踪核查暨《民法典》法条适用性跟踪分析

2020年5月28日，十三届全国人大三次会议高票通过了《中华人民共和国民法典》，自2021年1月1日起施行。民法典的颁布实施是中国特色社会主义法律体系达到新高度的重要标志，具有重大的里程碑意义。

此赛题旨对《民法典》颁布后的适用情况进行数据分析，包括但不限于以下任务：

（1）系统地统计分析裁判文书中民法典中各法条法款的适用情况，对各类案由案件引用的法条进行排名分析，解释法条被高频/低频使用的原因；

（2）分析社交媒体（微博）中对民法典各法条的讨论情况；

（3）对比分析文书和微博数据中法条适用情况，对潜在的一致和不一致的情况进行分析和阐述；

（4）结合两类数据，分析和挖掘《民法典》中潜在的适用性问题，对出台《民法典》相关的司法解释提供建议。

题目二：虚假诉讼问题分析

虚假诉讼主要是指当事人出于非法的动机和目的，采取虚假的诉讼主体、事实以及/或者证据提起民事诉讼，使法院作出错误的判决、裁定的行为。它与“恶意诉讼”有相似之处。

请研读我国关于虚假诉讼的法律规范、指导性案例，并基于提供的关于“民间借贷纠纷”或者“侵犯作品信息网络传播权纠纷”的裁判文书数据，进行数据分析和挖掘，完成以下任务：

（1）确定和实施甄别虚假诉讼的技术方案；

（2）制定人工辅助甄别虚假诉讼的任务清单；

（3）就已发现的涉嫌虚假诉讼案件形成报告；

（4）提出有关类案监督等溯源治理对策。

题目三：侵犯知识产权民事案件损害赔偿额计算方法及影响因素分析

知识产权损害赔偿额的计算有多种方法，而近年来《商标法》《著作权法》《专利法》修改后，均明确规定了惩罚性赔偿制度，由此有更多因素将影响最终的赔偿金额。

此赛题旨在结合裁判文书，对侵犯知识产权民事案件损害赔偿额计算问题进行深入分析，并探索惩罚性赔偿额的自动化辅助确定方法。包括但不限于以下任务：

（1）对侵犯著作权、专利权、商标权等知识产权民事案件判决中计算损害赔偿额所用的方法进行分析，并分析对于计算方法、损害赔偿额度、是否适用惩罚性赔偿、惩罚性赔偿额等问题的影响因素；

（2）尝试提出惩罚性赔偿额的自动化辅助确定方法；

（3）结合前述分析，对相关法律及其适用提出建议。

题目四：受贿罪或帮信罪司法类案检索

探索面向类案推送、类案检索的文书标注方法，设计标签体系，构建标注数据集，并进一步提出自动定罪和类案检索的技术方案。可任选帮信罪或受贿罪完成以下任务之一。

（1）自动定罪：

为训练计算机自动判断是否为受贿罪或帮信罪提供标注数据集；提出判断一个案件事实是否为受贿罪或帮信罪的标签体系，并给出法律依据和分析理由；给出针对受贿罪或帮信罪的定罪技术方案。

（2）类案检索：

为训练计算机判断是否为相似的受贿罪案件，或者相似的帮信罪案件提供标注数据集；提出判断两个案件事实是否为相似的受贿罪或帮信罪的标签体系，并给出法律依据和分析理由；给出针对受贿罪或帮信罪的类案检索系统的技术方案。

题目五：可解释的类案匹配算法

司法案例匹配是智慧司法的一项核心任务，其结果对多个下游任务具有重要影响——匹配的法律案件可为目标案件的判决提供支持性证据，影响着法律判决的公平和公正，对结果的可解释性有较高的要求。

本次比赛提供司法案例匹配任务的可解释评测数据集和相应的评估指标，用于评估匹配结果的可解释性及解释的精准性。

本任务技术评测使用的训练集和测试集来源于人工标注的5000对案例（案由均为“妨碍社会管理秩序罪”），人工标签分为匹配结果和匹配结果解释两部分。

匹配结果标签分为三级，分别为“匹配”/“部分匹配”/“不匹配”。

匹配结果解释标签包括：

（1）标注了所有案例中与类案匹配相关的司法特征句；

（2）对于匹配结果标签为“匹配”和“部分匹配”的案例对，标注了两篇案例中支持该匹配结果的司法特征句及特征句的对齐。

对于匹配结果，我们采用分类任务中的宏F1（Macro-F1）作为评价指标。

对于匹配结果解释，首先，评估单个案例的司法特征句提取准确性，评估模型提取的司法特征句与人工标注特征句的吻合程度，使用Macro-F1作为评估指标；同时，对于匹配标签为匹配或者部分匹配的案例对，评价案例对中支持匹配结果的特征句识别和对齐的准确性，同样使用Macro-F1对对齐结果进行评价。

最后匹配结果得分与解释结果得分取均值作为最终的分数。

请访问http://cail.cipsc.org.cn/并提交论文报告到RUCLAI的投稿系统中。

数据请登录中国人民大学VPN后访问中国人民大学交叉学科研究数据与工具平台下载。

地址：http://idata.ruc.edu.cn 请选择“人大授权登录”，使用学号或员工号登录。进入系统后选择“法律数据分析挑战赛”数据空间访问赛题数据。

关于本次挑战赛大家如有任何问题，

请加入群聊咨询

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

中国人民大学法律数据分析挑战赛

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

中金跳楼女生诡异之处。

生成图片，分享到微信朋友圈

中国人民大学法律数据分析挑战赛

您可能也对以下帖子感兴趣