大数据是规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。在法律领域,海量的法条、合同、裁判文书等法律相关文本就构成了这样的大数据。

    通过新兴的数据解构方式,我们可以让机器读懂这些文本,解读出和法律规则、交易规则、诉讼参与人等有关的重要信息,并且发现数据之间的关联,这将从根本上改变法律服务领域的已有格局和传统工作方式。

总的来说,大数据会从以下两个方面对律师行业带来深远影响。

    一、大数据的评价价值

    对律师行业来说,律师评价体系是最重要的基础设施:由于法律知识的专业性,法律服务的受众对律师能力没有足够的判断力,其对律师的选择必须依赖于外界提供的评价。可以说,评价体系是法律服务市场供需对接的基础,从根本上决定了资源配置的走向。

    然而,律师评价体系的建立却一直是律师行业里的一个难题。从律师主管机构的律师评级到一些市场机构发布的榜单,无一不因为样本的不全面和数据的不客观而或多或少地面临争议。有说服力的律师评价体系一直未能建立,这成为了制约行业发展的重要瓶颈。

    同样的道理,对法律服务的互联网化而言,如果不能解决评价体系的问题,同样无法建立当事人与陌生律师之间的信任关系,资源的高效匹配就无从谈起。

    不过,法律大数据可以为律师的评价体系提供更为客观的评价基础,从而在一定程度上解决律师能力的评价难题。

    比如说,从公开的裁判文书法律大数据中,可挖掘出全国诉讼律师的执业信息,为每一位律师“画像”。随着公开信息的增多,这样的“画像”甚至可能扩展到律师的非诉业务。

    比如说,从无讼阅读APP这样的法律内容社区的数据中,可以挖掘出律师们发表文章的情况,同行的评价与点赞则可以成为评价律师专业能力的重要依据。

    除此之外,法律行业里其实已经沉淀着一部分有关律师执业状况的数据:在律师行业里,司法行政机关和律协掌握着所有律师的注册信息、执业登记信息等基本数据;在法院系统里,也留存着律师的案件代理状况、提交的代理意见等数据;在教育机构里,存留着所有律师接受教育和培训的信息,只要整个法律行业的信息公开越来越彻底和深入,就可以采集到这一部分数据。

    将这些数据综合起来,就可以形成一个多维的律师评价体系。它是全面的,完全可以涵盖每一位律师;同时,它也是客观的,数据采集者的主观意愿可以被降到最低。

    当然,即使如此,律师能力的评价也还是会面临争议:不同的因素应该占多大的比例?数据积累的匮乏是否会导致年轻律师在法律服务市场上的劣势?

    其实,在互联网大数据时代,我们对律师评价的观念也应该适时更新。

    评价律师的最重要的意义是为客户选择律师提供参考,而并非单纯为了选出某一领域能力最强的律师予以嘉奖。不同的法律服务难度不同,对经验的要求也就不同,在某一领域内能力最强的律师并非是所有法律服务最佳的匹配者。相反,资深的优秀律师往往提供服务的定价也更高,反而不适于寻求相对低价的法律服务的客户。

    因此,律师评价体系不是为了评价而评价,而是为了更好地配置法律行业内的资源而评价。法律大数据能够为律师能力评价提供客观依据,但这并非配置资源的唯一因素。价格、服务意愿等因素也应该被一并纳入考虑。

    所以,其实没有必要担心建立在大数据基础之上的评价体系会对缺乏经验和数据的律师不利。定位在适合自己的细分市场里,打造出与之匹配的专业特色,每一个人都可以在法律服务市场里找到自己的位置。

    二、大数据的工具价值

    从根本上说,大数据提高了承载着法律专业知识的法条、合同、裁判文书等数据被机器分析、读懂甚至应用的可能性,从而为律师的工作提供辅助工具。

    当前最容易被采集、解构和分析的法律大数据,是法院上网公开的海量裁判文书。它不仅承载着律师的执业信息,更体现着每一位法官的裁判倾向。通过对裁判文书数据的深度挖掘,可以更好地理解裁判文书的内容,找出案件与案件之间的关联,帮助律师们从过往案例中提炼裁判规则。

    具体而言,裁判文书大数据的工具价值至少可以从以下五个方面体现出来:

    第一,提高法律检索的效率。通过对裁判文书的解构,可以实现更精准的关键词匹配,甚至可以判断裁判文书之间的相似性程度,自动向律师推送与他关注的裁判文书类似的其他裁判文书。更进一步地,当律师向系统上传新的案件的基本信息,系统将可以通过解构和初步标签化处理,自动推送相关案件和法律法规。这方面,目前我们的“无讼案例”已经实现了这些功能。

    第二,预判案件结果。“能不能赢”是当事人最为关心的问题,在过去,只有相关领域极为资深的律师,通过对案件和过往判例的深入分析,才可以得出一个倾向性的结论,但是在大数据的帮助下,可以由系统自动找出相似案例,并且分析以往案例的裁判结果,从而给出对当下案件的预判情况。这样的案例数据基础更为全面,也会比人工的判定方式更加准确,同时,它将在第一时间呈现预判结果,帮助当事人更加理性地看待诉讼。

    第三,辅助制定诉讼策略。除了通过提供审理法官的相关观点、最新审判的价值判断等信息,为争议本质提供新的洞见之外,大数据还可以辅助判断证据材料的可采纳性程度:只要将证据材料与待证事实之间的关联关系作为标签,对这种关联关系是否成立进行大数据分析,评估证据与案件事实间的关联关系,就可以辅助律师预判证据被法庭采纳的可能性大小。

    第四,解决律师费报价的问题。案件究竟应该收多少的律师费才是合理的?这是律师和客户都感到十分困扰的问题。尽管有律协的指导性定价,但是由于市场信息的不透明,律师仍然很难把握收费标准,畸高畸低的情形时有存在。但是,如果全国的律师和当事人都愿意到互联网平台上贡献律师收费数据,就能够对同类案件的市场平均价格快速获取并统计,结合案件难度为诉讼代理寻求合理报价。同时,这样的价格数据也将成为匹配法律服务供需双方的重要依据。

    第五,提供服务全程数据支持。前述四个方面的工具性价值并非只能通过一个个单独的互联网工具来实现,它们可以被嵌入一套互联网化的律师办案流程中,从而在律师工作的每一个阶段提供数据支持。比如说,为律师提供在线的工作模板,自动推送相关的法律法规和法官的裁判倾向,从而为律师的工作提供智能辅助,提高律师工作效率。

    以上五个方面是我对未来裁判文书大数据应用的一些畅想。它们并非立即可以实现,但却是在大数据的支持之下的可以预期的未来。

这只是一个应用的例子。通过对法律法规数据、合同文本数据等法律数据的搜集和深度分析,可以预见,大数据为律师工作带来的工具价值将是全方位的。

    三、大数据与律师行业的未来

    应该注意的是,大数据的评价价值与工具价值并非截然独立,而是彼此促进的。

    一旦律师的工作更多地依赖于线上的大数据办案工具,并且养成线上工作习惯,就可以收集到律师的工作数据,从而将律师的每一次作业过程纳入评价体系,形成对律师更全面准确的能力评价。同时,根据律师使用大数据办案工具的反馈,又可以进一步优化工具本身,更好地为律师提供辅助。

    这将完全改变人们依靠人脉找律师,律师在拓展人脉上花费太多精力而忽视专业能力本身的现象,律师执业仅凭个人知识和经验积累的“刀耕火种”的作业方式也将被改变。

    可以说,法律大数据对于律师行业的最核心意义在于,它为分析经验和专业知识提供了工具。它既让普通人有了辨识陌生律师法律服务水平的能力,也为个性化极强,极其依赖于律师个人的知识和经验的律师工作提供了辅助工具。

    法律大数据甚至为人工智能技术的发展提供了至关重要的训练基础。未来,当机器积累和学习了足够多的法律数据,它将发展为法律界的人工智能,在一定程度上替代律师的部分工作。事实上,建立在IBM的Watson认知计算系统基础上的Ross法律应用已经开启了这样的未来:使用者可以用通俗易懂的英语向它提出法律问题,它则会自动检索成文法、判例法以及其他资源。

    这无异于工业革命之初棉纺机器对纺织工人的意义:工业革命中的机器替代的是人的体力劳动,并通过大规模生产的方式提高行业生产力水平;大数据技术则可以在信息不对称极其严重的法律服务领域实现更为高效的资源配置,免去律师花费在人脉上的过多精力,同时在一定程度上替代人的脑力劳动,甚至比人做得更好:对律师来说,要搜集并且阅读相关领域的所有案例并且对其烂熟于心几乎是不可能的事情,大数据则可以轻而易举地做到。

    借由大数据的辅助,整个行业的资源配置方式和律师们的工作方式将大大不同于以往。律师工作将迎来“机器辅助时代”,将其称之为法律服务领域的“工业革命”或许都并不为过。