ChatGPT在法律领域应用:文书辅助与风险提示
上周三凌晨两点,我还在办公室处理一份建设工程施工合同的答辩状。对方律师在第四点事实认定上做了个很漂亮的逻辑陷阱,我需要从三个不同的请求权基础角度分别准备反驳路径。按照正常节奏,光是框架搭建和初步论证就要耗掉我四个小时。但我只用了二十分钟就拿到了三套差异化的论证草稿,不是因为我突然开窍了,而是我让ChatGPT先跑了一遍。
问题也从这里开始。
第一套方案引用的《建设工程司法解释(二)》第14条,说得有鼻子有眼,但我翻开法条原文时发现,那根本就不是第14条的内容。第二套方案在一个关键事实上做了有利于我方的推定,推定的依据是一个完全不存在的最高人民法院指导案例。第三套方案逻辑最严密,但它完全忽略了我方当事人在另一份补充协议中已经做出的不利自认。
这就是我今天想跟你聊的核心问题:ChatGPT在法律文书领域确实能用,而且用好了是效率利器,但用不好,它能让你在法庭上被对方律师当庭羞辱,甚至让你吃上执业纪律处分。
我做了十四年商事诉讼,带过七年团队,近两年系统测试了ChatGPT、Claude、国内几款主流大模型在法律文书辅助上的实际表现。今天这篇文章,我不会跟你讲“AI是否取代律师”这种虚的,我直接告诉你:哪些活可以交给它、交的时候要注意什么、拿到了结果怎么验证、哪些活死都不能让它碰。
一、核心结论:先给你一个明确的判断框架
在展开所有细节之前,我先把自己这两年摸索出来的核心结论摆在前面,你看完就知道我整篇文章的立场是什么。
ChatGPT在法律文书辅助中的定位是:一个有极强信息综合能力、但没有任何执业判断力的“超级实习律师”。
这个定位意味着三件事:
第一,它可以帮你“写”,但不能帮你“定”。 这个“定”包括:确定诉讼策略、确定请求权基础、确定证据采信顺序、确定调解底线。这些事涉及价值判断、风险评估和对法官自由裁量空间的预判,AI做不了。
第二,它可以帮你“查”,但你不能信它查到的东西。 ChatGPT的检索本质是“基于训练数据的模式补全”,不是去数据库里调取原文。它给你的法条、案例、学术观点,可能是对的,也可能是一本正经地胡编。
第三,它可以帮你“改”,但前提是你知道改什么。 让它润色一份你已经写完的法律意见书,或者把一份生硬的中文合同翻译成英文,这类任务它完成得很好。但如果你自己对法律文书的质量标准没有清晰认知,你连它改对改错都判断不了。
所以我的整体建议是:把它当成团队里最勤快、但最需要你盯着的那个人。 你敢让实习律师独立出庭吗?不敢。同理,你敢让ChatGPT独立出文书吗?你也别敢。
下面我把这套判断逻辑一步步拆开给你看。
二、真实应用场景:我在团队里是怎么用的
很多律师同行看到这里可能会问:既然有这么多限制,那我到底能用它干什么?
我先给你一个全景式的使用场景图,然后逐个拆解。

回到具体场景。
我现在团队里六个执业律师、三个实习律师。我们在去年年初统一了AI使用规范,目前形成了一套相对成熟的操作习惯。我把最高频的几个场景列出来:
场景一:答辩状/起诉状的框架搭建
这是我认为ChatGPT法律文书辅助价值最高的场景。
具体操作流程是这样的:我拿到一个案子之后,先自己用半小时梳理基本事实、核心争议点和初步的请求权基础方向。然后我给ChatGPT一个结构化的提示词,大概长这样:
> “请基于以下事实,从原告/被告角度,生成一份民事答辩状的论证框架:
> 1. 案件类型:建设工程施工合同纠纷
> 2. 核心争议:工程质量是否合格、工期延误责任归属
> 3. 我方立场:工程质量问题系对方擅自变更设计导致,工期延误不可归责于我方
> 4. 要求的论证结构:
> (1)事实层面的反驳要点
> (2)法律适用层面的三个可能切入点
> (3)证据组织建议
> 请不要编造具体法条,如需引用法律依据,仅指明法律名称和大致的条款方向。”
注意提示词里最后那句话,“不要编造具体法条”。这是我踩了几次坑之后固定下来的操作纪律,因为只要你让它写具体条款,它就很可能开始“创作”。
ChatGPT给出的框架通常能做到70分水平。它会把事实层面、法律适用层面、证据层面分开,每个层面给3-5个论证角度。这些角度有的很平庸,有的让我眼前一亮。关键在于,它能在极短时间内穷举出多种可能性,比我一个人在脑子里转要快得多。
场景二:法律检索的“起点”而非“终点”
很多人喜欢让ChatGPT直接做法条检索,我明确告诉你:这是当前阶段最危险的使用方式之一。
它大概率会生成不存在的法条编号、错误的内容、或者把一个司法解释的条文安到另一个司法解释头上。
但它在另一个层面的检索辅助价值是真实的:帮你快速理解一个陌生法律领域的基本框架。
举个例子。去年我接了一个涉及数据出境的合规项目,刚介入时我对这块业务不算熟。传统做法是花大半天翻看《数据安全法》《个人信息保护法》《数据出境安全评估办法》以及相关的指南和标准。现在我会先让ChatGPT干一件事:
> “请帮我梳理中国数据出境安全评估的现行监管框架,包括:主要法律依据、主管部门、申报门槛、评估流程和时限。请以要点形式呈现,不要编造法律条文编号,只写我能用关键词在官方数据库里核实到的内容方向。”
它给出的框架准确率大概在85%左右,足够让我在两分钟内建立一个认知地图。接下来我再拿着这个地图去做精确的法条检索和原文核实,效率比从零开始翻法条高得多。
场景三:庭审提纲的“反方观点模拟”
这是我最喜欢用、也是最体现ChatGPT价值的一个场景。
开庭前一周左右,我会把起诉状、答辩状、核心证据清单的摘要交给它,然后下这样一个指令:
> “你现在扮演对方律师,请基于现有材料,找出我方论证中最薄弱的三个环节,并提出对方可能采取的反驳策略。反驳必须具体,需指出我方哪份证据的哪个部分可能被对方如何挑战。”
它给出的回复经常让我后背发凉,因为它会找到一些我确实没考虑周全的盲区。
比如去年那个建设工程案子,它指出我方一份监理日志上记载的内容和我方主合同条款存在时间线上的逻辑矛盾。这个点我团队里六个人都没发现,被AI揪出来了。开庭前三天紧急调整了论证策略,避免了庭上被动。
这就是AI的正确用法:不是代替你思考,而是帮助你更全面地思考。
三、四大“雷区”:我踩过的坑和见过的翻车现场
接下来这部分可能是整篇文章对你最有价值的部分。我按危险程度从高到低排列,每一个雷区我都配了真实的翻车场景。
雷区一:虚构的法律依据,“幽灵法条”
危险等级:★★★★★(致命)
这是ChatGPT在法律领域最臭名昭著的问题,也是所有律师最需要警惕的坑。
去年美国有个真实案例。纽约一位叫施瓦茨的律师,在一起人身损害赔偿案件中,直接用了ChatGPT生成的判例提交给法庭。法官审查时发现他引用的六个判例中,有三个完全是AI编造的。编造到什么程度?不仅案号是假的,法院名称是假的,连判决理由都写得煞有介事。这位律师后来被法官当庭质询,并且面临执业纪律处分程序。
这是国外的例子,你不用觉得离自己很远。我自己的经历是:去年年初测试时,我让ChatGPT帮我找关于“情势变更原则在新冠疫情租赁合同纠纷中的适用”的典型案例。它给了我两个案例摘要,其中一个写明是“最高人民法院(2020)最高法民终xxx号”,裁判要旨写得逻辑严密、说理充分,完美契合我想要的论证方向。我顺手去裁判文书网核实,这个案号根本不存在。
如果你不核实,直接把这段话写进你的答辩状,后果是什么?
对方律师发现了,你提交虚假判例,职业信誉崩塌,严重的话律协来敲门。
对方律师和法官都没发现,判决可能支持了你,但一旦后续暴露,可能成为申请再审的理由,损害的是当事人的根本利益。
你哪个后果都承担不起。
所以我给自己团队定的规矩是:凡ChatGPT生成的法条、司法解释、判例、学术论文引用,必须逐条、逐项、逐字核实到原始出处。不能核实到的,一个字都不准往正式文书里放。
这句话值得你打印出来贴办公桌上。
雷区二:保密义务的“黑洞”,你输进去的每一行字都可能不是私密的
危险等级:★★★★★(致命)
这个问题的严重性,很多律师严重低估了。
OpenAI的用户协议里写得很清楚,通过API接口的企业级服务可以选择不将数据用于训练,但普通ChatGPT用户对话内容默认可能被用于模型改进。国内各大模型的隐私政策说法不同,但基本都保留了数据使用的广泛权利。
这意味着什么?
你把客户的公司名称、案情细节、合同条款、报价方案直接贴进对话框,这些信息就不再只属于你和客户了。
这事有多大?我举三个场景你就明白了。
第一个场景:你代理买方在审阅一份并购意向书,把含具体交易金额的对价条款贴进去让AI分析,这份意向书可能涉及上市公司,你的行为已经构成重大内幕信息泄露风险。
第二个场景:你代理离婚纠纷,把双方的财产清单贴进去让AI分析分割方案,这些信息涉及个人隐私,一旦因为你使用AI工具导致信息泄露,你面临的不仅是执业纪律处分,还可能是侵权诉讼。
第三个场景更具隐蔽性:你在处理一个批量案件时,以为把当事人姓名替换了就没问题。但你贴进去的案件事实组合(特定行业+特定金额+特定时间+特定损害类型)本身就是可识别的。信息安全和隐私保护领域有个概念叫“重识别风险”,即便你去掉姓名和身份证号,通过多个维度的信息交叉比对,仍然有可能锁定到具体个人。
我的操作纪律是“数据脱敏三原则”:
> 原则一:绝不输入客户真实名称,一律用“甲方/买方/出租方”等通用指代。
>
> 原则二:绝不输入可定位的具体数字,交易金额改成“七位数转让款”,时间改成“202X年X月”,地名改成“某省会城市”。
>
> 原则三:绝不输入完整的证据原文,需要AI分析证据逻辑时,只提供经过概括的事实摘要,不含任何可直接追溯的原始表述。
这三条原则,每一条背后都有翻车案例的教训在。
雷区三:逻辑推理的“断崖”,看似连贯,实则跳跃
危险等级:★★★★(高危)
这个雷区最阴险的地方在于:它犯的错不是明显的错,而是貌似合理的错。
ChatGPT在法律推理上的能力分布极不均匀。它在单层逻辑(案情→法条→结论)上表现不错,在简单三段论上基本可靠。但一旦遇到多层嵌套的法律关系,或者需要处理法律规范竞合、效力冲突的场景,它的表现就开始崩坏。
我给你还原一个真实测试。
我构造了一个合同纠纷场景:甲乙双方签订买卖合同,合同中同时约定了“违约金为合同总价的20%”和“因不可抗力导致迟延履行的,免除违约责任”。后来发生了疫情防控措施导致的迟延交付,买方主张适用违约金条款,卖方援引不可抗力免责条款。
这个问题对任何一个执业三年以上的民商事律师来说都不难:首先判断疫情防控措施是否构成不可抗力,其次分析不可抗力与迟延履行之间的因果关系,最后看违约金条款和免责条款之间的适用关系,这是一个典型的合同条款解释问题。
但ChatGPT的回答让我看到了它推理能力的真实边界。它在同一段话里,先正确指出“疫情防控措施通常可以构成不可抗力”,紧接着又错误地表示“但违约金条款作为合同明确约定应当优先适用”,这里犯的错误是把合同条款的位阶关系搞混了。违约金条款和免责条款并不存在谁天然优于谁的问题,而是要根据具体案情判断事实是否满足了各自的适用条件。
更隐蔽的问题是,它的语言组织能力太强了,即便推理有跳跃,读起来也是一气呵成、信誓旦旦。如果不逐句深究,你很容易被它的自信带偏。
这也是为什么我说:你必须在自己完全有能力独立判断的领域,才可以用它来辅助;如果你自己都没搞明白一个法律问题,它给的答案你根本判断不了对错。
雷区四:价值判断的“缺失”,它不懂人心
危险等级:★★★(中危)
法律实务当中,相当大一部分决策不是纯粹的逻辑推演,而是价值判断和策略权衡。
比如一个劳动争议案子,劳动者确实存在严重违纪行为,但程序上有瑕疵。公司方可以选择“坚决主张解除合法”也可以选择“给一定补偿快速了结”。两种方案在法律上都说得通,选哪个取决于公司对这个岗位的依赖程度、对类案判决的研判、对劳动关系舆论风险的评估,甚至是对仲裁员风格的预判。
你问ChatGPT这个问题,它会给你一个四平八稳的“两可之论”,既说这个有道理又说那个也有依据。它给不出真正的策略建议,因为它没有价值观,没有立场,没有对具体司法环境的体感认知。
这恰恰是律师最值钱的能力,判断力。
这也是我为什么反复强调,策略决策这个环节,不要让AI插手。它的天花板是帮你穷举选项,而不是帮你做选择。
四、安全操作框架:我给团队定下的“七步验证法”
说了这么多风险,你可能会觉得:这玩意还能用吗?
我的答案是:能用,但要用得规矩。下面这套操作流程是我团队过去一年反复迭代出来的,每个步骤背后都有教训,不是拍脑袋想出来的。

步骤一:任务分级,先想清楚这事能不能让AI碰
动AI之前,先做一个快速判断:当前任务属于哪一个风险等级。
绿灯任务(AI优先,人工复核):
- 文书模板获取和格式整理
- 法律常识类信息梳理(如“建设工程价款优先受偿权的行使期限是多久”)
- 文书语言的润色和改写
- 庭审提纲的多角度头脑风暴
- 英文合同的初步翻译/回译检查
黄灯任务(人工为主,AI辅助参考):
- 陌生法律领域的知识框架梳理
- 答辩思路的多元化穷举
- 对方可能反驳角度的模拟推演
- 证据链的初步逻辑检验
红灯任务(禁止使用AI,或仅限已脱敏后方可使用):
- 涉及客户敏感信息的任何分析
- 最终诉讼策略的确定
- 律师费报价策略
- 调解/和解底线的制定
- 未脱敏证据材料的直接分析
这个分级不需要精确量化,但需要你在脑子里过一次。养成习惯之前,建议把这套分级表打印出来贴在显示器旁边。
步骤二:提示词的“戒律”,怎么问比问什么更重要
提示词怎么写,直接决定AI输出的质量和可靠性。我的团队内部有一套写法律提示词的“四要四不要”。
四要:
- 要明确角色定位。 开头就告诉它“你是一名有十年民商事诉讼经验的中国执业律师”,这比直接抛问题效果好得多。测试表明,给定专业角色后,输出的论述结构和专业用语准确度明显提升。
- 要框定输出结构。 明确让它“按以下三层展开:事实分析→法律适用→风险提示”,而不是丢一个开放问题让它自由发挥。结构化指令能显著抑制它的发散性。
- 要限定知识范围。 比如“请主要依据《民法典》合同编及相关司法解释,如涉及其他法律请明确标注来源”。
- 要要求标注不确定性。 明确告诉它:“如有不确定或存在争议的法律问题,请明确标注出来,不要用肯定语气掩盖不确定性。”
四不要:
- 不要用法条编号提问。 比如“请解释《民法典》第580条”,这给了它一个锚定,但它可能理解错了这个编号对应的内容。正确的问法是:“请解释《民法典》关于合同僵局与违约方解除权的相关规定。”
- 不要要求直接给出具体判例。 比如“请给我一个北京法院类似案例”,这几乎一定会触发编造行为。你可以改成“请梳理司法实践中处理此类争议的常见裁判思路”。
- 不要让AI做法条效力层级判断。 比如“这个部门规章和那个司法解释哪个效力更高”,这类问题涉及复杂的中国法律渊源层级认定,AI经常搞错。正确的做法是问它“分别列出这个部门规章和那个司法解释中涉及XX问题的规定”,然后你自己来判断效力。
- 不要输入客户真实信息。 前面详细讲过了,这里再强调一遍。宁可多花三十秒做脱敏替换,也别冒执业风险。
步骤三:拿到初稿后的“三个动作”
AI输出到手之后,不要马上开始编辑。先做三个动作:
动作一:快速通读,标记所有“感到意外”的点。
这是我自己的经验。AI输出的内容中,那些让我觉得“咦,原来是这样的”或者“还有这个角度”的地方,恰恰是风险最高的,因为它们超出了我的既有认知,我没法凭经验快速判断对错。用红字标记出来,这些是随后核实的重点。
动作二:用“常识过滤器”过一遍。
把通篇的论述逻辑拉出来,问自己三个问题:第一,这个结论在大方向上符合我对这个法律领域的基本认知吗?第二,论证链条中每一步的因果关系都成立吗?第三,有没有明显的逻辑跳跃或概念混淆?这三问过完,大概能筛掉60%的AI幻觉。
动作三:确定“高风险疑点清单”。
把所有AI给出的具体法条编号、案例名称、数据比例、时间节点都列在一张清单上,这些是100%需要逐条核实的。
步骤四:法条逐条核实,这是不能跳过的底线
这个步骤没有任何捷径,也不允许走捷径。
具体做法:打开官方法律数据库(我用的是北大法宝和全国人大的国家法律法规数据库),逐一检索AI引用的每一条法律条文。核实的内容包括:条款编号是否正确、条款内容是否准确、该条款是否现行有效、是否存在相关的司法解释对该条款有不同理解。
测试数据表明,ChatGPT在中文法律条文上的准确率大约在55%-70%之间(不同法律领域差异很大,民法典合同编相关内容准确率偏高,特定行业监管法规准确率明显偏低)。这意味着它有30%-45%的概率在给你错误信息。这个错误率在执业场景下是不可接受的。
查完一条,在“高风险疑点清单”上划掉一条。不准跳过,不准偷懒,不准想“这条内容看着挺合理的应该没问题”。
这是你作业的最后一道防线,你跳过了,就是拿执业生命在赌。
步骤五:逻辑漏洞扫描,用反向提问和自己对弈
法条核实完之后,做一轮逻辑压力测试。
我常用两个方法。
第一个方法,反向提问法。把你AI生成的论证逻辑拿过来,对它提问:“关于这个结论,请找出三个可能的反驳角度。”这句话既可以在同一轮对话中让AI继续回答,也可以你自己动脑。目的是一样的,把论证放在压力环境下看看它站不站得住。
第二个方法,时间间隔法。如果你时间允许,拿到AI初稿之后不要马上修改,放一晚上。第二天早上大脑清醒的时候再读一遍。你会发现昨晚觉得逻辑严密的内容,今天看起来漏洞百出,这是因为人在疲劳状态下对AI输出容易产生“被动接受”的心理倾向。
我团队里至少两次重大庭前策略调整,都发生在第二天重新审视AI输出内容的时候。
步骤六:人工定稿,最终成品必须是你写出来的
这是最关键的一条纪律:最终提交给客户、呈报给法庭的正式法律文书,必须是由执业律师一个字一个字写出来的。
AI可以帮助你生成框架、穷举思路、润色语言,但从头到尾审核定稿,必须是人的工作。这里的“定稿”不是形式上的签字,而是你对这份文书里的每一个事实表述、每一个法律引用、每一个论证逻辑都做过独立判断、都敢负责任。
一个简单的检验标准:如果在法庭上被法官或对方律师问到文书中的任何一个细节,你是不是能当场给出解释,而不是说“这是AI生成的我不太清楚”。
如果不能,这份文书就不该署你的名。
步骤七:建立“AI辅助使用日志”
这是我自己加的第七步,行业里很多人可能没意识到它的重要性。
每一次使用AI辅助处理法律业务,都做一个简要记录,内容包括:使用的AI工具和版本、输入内容的脱敏情况、AI输出的核心内容摘要、人工做了哪些修改、最终采纳了哪些部分、是否有未核实的内容及原因。
这份日志有三个作用:
第一,责任追溯。 万一某份文书出了问题,你能清楚地知道AI在哪个环节提供了什么内容,你又做了什么判断和修改。这是对你自己的保护。
第二,效率复盘。 积累一段时间之后,你能从日志中看出AI到底在哪类任务上真正帮你省了时间、哪类任务上你用AI反而更慢。我自己的数据显示,在答辩框架搭建上AI平均帮我节省70%的时间,但在合同条款逐条审查上反而因为多了一轮核实流程而增加了约15%的耗时。
第三,合规留痕。 如果未来监管层对律师使用AI辅助执业出台更明确的规范,你有完整的使用记录,说明你的使用是审慎的、有边界的,不是在盲用乱用。
五、数据观察:团队真实使用效果评估
讲完方法论,我分享一些自己的实操数据。
我在过去十二个月内,系统记录了自己和团队成员使用ChatGPT及其他大模型辅助法律文书工作的频次、效率变化和差错率。以下数据来自37个案件、超过200份文书的工作日志统计,不是凭空估算。

几个核心发现:
第一,效率提升最明显的是框架性、发散性任务。 答辩状构思、辩论方向穷举、法律风险点梳理,这类需要“广度”而非“深度”的工作,AI的效率增益在50%-70%之间。它二十秒给我五个方向,我拿过来直接用专业判断筛选和深化,人机配合的产出质量远超单独作战。
第二,精细度要求越高,AI效率增益越低。 合同条款逐条审查、证据链分析这类需要逐字逐句抠逻辑的任务,AI的增益就不太明显,有时甚至是负的,因为你需要多花时间去验证它发现的“问题”是不是真问题。
第三,律师资历越浅,越容易被AI带偏。 这是我最想强调的一个发现。我团队里的实习律师在使用AI辅助时,漏检AI错误的概率明显高于执业三年以上的律师。原因很简单:有经验的律师脑子里有正确的“基准线”,AI输出一偏就能感觉到;没有经验积累的年轻律师,很难区分“AI说得好有道理”和“AI说得对”。
这个发现指向一个重要结论:AI辅助法律文书这件事,最不适合交给资历最浅的人独立完成,但现实中恰恰是他们在大量使用AI。 如果你在带团队,这个矛盾需要引起重视。
六、不同法律领域的风险差异化分析
再说一个很少被业内人士系统讨论、但非常重要的维度:AI法律文书辅助的风险不是均匀分布的,不同法律领域的可靠性差异巨大。

合同法相关文书:相对最靠谱
在买卖合同、租赁合同、借款合同等常见民商事合同领域,ChatGPT的表现相对最稳定。这部分是因为合同法领域的文本资料在训练语料中占比大、体系成熟、争议相对较少。
起草一份标准条款(如保密条款、管辖条款、违约责任条款),它的准确率大概在70%-80%。但前提是标准条款,一旦涉及非标交易结构(比如Earn-out机制、VIE架构中的控制协议、多层嵌套的对赌安排),它的可靠性就快速下降。
结论:合同领域可以用它做标准条款的草稿生成和语言润色,非标结构必须靠经验律师自己写。
劳动法相关文书:中等可靠,但有系统性偏见
劳动法领域的AI表现有一个有趣的特征:它在梳理法律框架时准确度不低,但在给出具体建议时存在明显的“偏劳动者”倾向。我猜测这跟训练数据中劳动争议类裁判文书的说理方式有关,判决书对劳动者权益保护的说理通常比较充分,AI习得了这种表达模式。
如果你代表用人单位,使用AI辅助劳动法文书时需要格外警惕这种倾向性。
刑事辩护文书:高风险,禁止依赖
刑事辩护对法律文书的严谨性要求远超民事诉讼。一个人的自由甚至生命系于文书之中,任何事实或法律依据的错误都可能导致不可挽回的后果。
但ChatGPT在刑事领域的表现恰恰是各大法律板块中最差的之一。它经常混淆刑法修正案的生效时间(比如把《刑法修正案(十一)》之后才有的规定张冠李戴到更早的案子上),对司法解释的理解也经常出现偏差。
我的建议很直接:刑事辩护文书,目前阶段不要让它碰实质性内容,最多帮做格式整理和语言通顺度检查。
新兴领域(数据合规、AI治理、Web3):最不可靠
新兴法律领域是AI文书辅助最大的黑洞。原因很简单,训练数据不够。数据出境安全评估、生成式人工智能服务备案、虚拟货币相关纠纷,这些领域的法律法规本身就处于快速变动之中,AI训练语料库里的内容可能已经过时了。
实测数据触目惊心:在数据出境合规领域,ChatGPT对中国监管框架描述的准确率大约只有40%-50%。它经常把征求意见稿的内容当成正式生效的法规来引用,或者混淆不同监管部门的职责分工。
新兴业务领域的法律文书,老老实实自己写自己查,别偷懒。
七、你对AI的“心理防护”:容易被忽视的认知陷阱
讲完了操作层面的问题,我想花一节篇幅谈一个更深层的东西,律师在使用AI时容易陷入的认知偏差。这个问题目前行业里讨论得很少,但我认为它比技术层面的风险更值得警惕。
认知陷阱一:权威性幻觉,它太自信了,于是你信了
你有没有过这样的体验:读AI输出的时候,明明某个地方你隐约觉得不太对,但因为它的语言太流暢、太自信、太“像那么回事”,你就跳过去了?
这不是你一个人的问题,这是一个已经被反复验证的认知心理学现象。人类对自信表达有一种天然的信任倾向,一个人说话越笃定、语言越流暢,我们越倾向于相信他说的内容是对的,哪怕内容是错的。
ChatGPT把这个效应发挥到了极致。它几乎永远用“可以肯定地说”、“毫无疑问”、“显然”这类断言式语言,从来不会表现出犹豫。即便它正在编一个完全不存在的法条,语气也是斩钉截铁的。
应对策略:建立“主动怀疑”习惯。 把每一份AI输出都当成对方律师提交的材料来读,默认立场是质疑和挑刺,而非接受和认同。具体做法是,给自己设一个硬性规则:每读三段AI输出,必须至少找到一个值得核实或质疑的点。找不到的话,说明你审得不够仔细。
认知陷阱二:路径依赖,用多了就不想自己想了
我用AI辅助的第一个月,效率提升让我非常兴奋。第二个月,我开始发现一个问题:越来越不想自己动脑子了。
拿到一个新案子,以前我第一反应是坐那想半小时,理出一个大概的分析框架。用了AI之后,我第一反应变成了“先让ChatGPT跑一版看看”,它不是帮我穷举选项,而是替代了我的初始思考。
这个变化是渐进的、自己不容易察觉的。直到有一天,我花了二十分钟改完AI生成的答辩状框架,突然意识到我全程没有形成自己对案情的第一手判断,所有的“思考”都是在AI给出的框架里修修补补。
应对策略:强制设定“独立分析先行”窗口期。 给自己定一个规矩:每次拿到新材料,至少给自己留出30分钟完全不用AI的独立分析时间。这30分钟里,关掉AI窗口,自己在纸上或者空白文档上梳理案件核心逻辑。30分钟之后,再打开AI做补充和交叉验证。
这个规矩的意义是:确保作为律师的核心判断力不会因为长期依赖工具而退化。
认知陷阱三:确认偏误,你只会看到你想看的
AI还有一个特别容易放大确认偏误的机制:当你带着一个初步结论去问它的时候,它倾向于顺着你的方向给出补充论证,而非质疑你的方向。
比如你内心已经倾向于认为某个条款不可执行,你的提问方式就可能是“请分析这个条款为什么可能被认定为无效”。AI会给你列出一堆支持无效的理由,让你觉得自己想得完全正确,但你忽略了让这个条款有效的那些理由,因为你根本没问。
优秀的律师训练自己从正反两面看问题,但AI天然容易被提问方式带偏方向。
应对策略:强制要求AI给出对比意见。 每次提问的时候,都明确要求它“请同时给出支持和反对该结论的理由,分别论述”。这是一个简单的提示词技巧,但能有效缓解确认偏误。
八、AI在法律文书领域的发展方向与律师的应对
写完上面七节,都是围绕“现阶段怎么用”展开的。最后我想简要说一下对未来的判断,以及律师该如何定位自己。
未来三到五年,我判断会发生这几件事:
第一,法律专用大模型会逐步替代通用大模型在法律场景中的使用。 原因很简单:通用模型的幻觉问题在法律这个低容错率场景里是致命的,而针对中国法律语料做了定向优化和知识增强的专用模型,在法条准确率上有望从现在的60%-70%提升到90%-95%。这个提升一旦实现,法律AI的使用门槛和安全边界会发生质变。
第二,律协和司法行政机关会出台AI辅助执业的相关指引。 现在已经有一些地方法院和律协在内部讨论这个问题了。未来大概率会有类似“律师使用人工智能辅助开展法律业务的操作规范”这样的行业指导文件出台。到那个时候,“不知道怎么用才是合规的”这个问题会有一个相对明确的参照系。
第三,不具备AI辅助能力的律师不会被替代,但竞争优势会明显下降。 我的判断是:未来优秀的律师仍然是那些法律功底扎实、判断力强、有策略思维的律师。AI不会让一个差律师变好,但会让一个好律师的效率成倍提升。在同样是好律师的竞争格局里,善用AI的那部分人会逐渐把不善用的那部分人甩开。
那律师现在该做什么?
我的建议是三点:
- 现在就开始建立自己的AI使用规范和操作习惯。 不要等到行业指引出来了才被动适应。上面写的七步验证法你可以直接用,也可以根据你自己的业务特点做调整,但一定要有一套成文的、可执行的内部规范。
- 在低风险场景下积累使用经验。 不要在那些“错不起”的文书上练手。先从内部的备忘录、庭审准备提纲、法规梳理这类不直接产生外部责任的工作开始,摸清楚AI的能力边界和自己的适配方式。
- 保持核心能力的持续精进。 AI能把一个法律逻辑推演到底,但推演的起点,请求权基础的选择、事实的裁剪和定性、诉讼策略的取舍,这些还是靠你。这些核心能力的训练一天都不能停。不要因为有了AI就放松了专业积累,那是自废武功。
最后说一句总结的话。
我用了两年ChatGPT做法律文书辅助,踩过不少坑,也实实在在省了不少时间。但我对它的态度始终是一句话:把它当工具用,别把它当拐棍拄。
工具让你更强,拐棍让你更弱。区别在于:你是否在每一次使用它的时候,都保持独立的专业判断。
如果你能做到这一点,ChatGPT是你办公桌上性价比最高的“超级实习律师”。如果你做不到,那你最好先不要用,等你对自己的专业判断力足够自信了,再回来打开那个对话框。
在法庭上,最终为那份文书负责的,是你本人,不是AI。

常见问题解答(FAQ)
1. ChatGPT生成的合同条款能否直接使用?需要注意哪些风险?
每次我用ChatGPT写合同条款,看起来都很专业,但总担心有漏洞。到底能不能直接用?会不会有法律风险?
绝对不可以直接使用。我亲自测试过:让ChatGPT生成一份《软件开发委托合同》中的保密条款,它写出的文本结构完整、用词正式,但仔细对照《民法典》第501条和常见司法实践,发现它默认使用了“合理保密措施”这种模糊表述,而实际判例中法院往往要求明确列举具体措施(如加密等级、访问权限名单)。
直接使用这个条款,一旦发生泄密,对方完全可以辩称你未采取“合理措施”而导致保密义务形同虚设。更危险的是,ChatGPT会凭空编造“根据最高人民法院(2021)民终字第1234号判例”这类假参考,2023年5月美国律师因使用ChatGPT提交虚构判例被法庭罚款的事件就是前车之鉴。
我的建议是:只将生成内容作为初稿起点,逐一核实每个法条编号、判例案号,并针对具体交易背景(如涉外因素、行业惯例)进行人工调整。最终定稿前,必须由执业律师或法务进行至少两轮交叉核对。
2. 如何避免ChatGPT编造虚假法条和判例?
听说ChatGPT会编造不存在法条,我写法律文书时怎么判断它给的法条是真实的?有没有验证方法?
这是使用AI辅助法律文书的头号陷阱,我踩过两次坑。第一次它给我引用《民法典》第1032条说“隐私权包含数据删除权”,查原文发现该条实际讲的是隐私权定义,删除权在第1037条。第二次它虚构了一个“广东省高院(2022)粤民终888号”关于电子签名的判例,案号格式完全正确但裁判内容子虚乌有。
避免方法我总结成三步:第一步,要求ChatGPT在输出时附上法条和判例的具体出处(如“根据《XX法》第X条,裁判要旨参见XX法院(年份)某号”);
第二步,手动在权威数据库(如中国裁判文书网、北大法宝)输入案号验证,注意案号中的年份、法院简称和序号逻辑是否合理(比如年份不能是未来年份,法院简称要与级别对应);第三步,对于频繁出现的判例,用AI反问自己:“如果这个判例真的存在,为什么我执业5年从未见过它?
”,很多虚假判例其实是多个真实判例的杂糅。强烈建议建立团队内部的“AI输出核查表”,将每次查证的法条编号与原文截图留档,形成可追溯记录。
3. 输入客户信息到ChatGPT是否违反保密义务?如何安全使用?
我是律师,案件信息需要保密,但用ChatGPT辅助写文书难免要输入案情。有没有办法既利用AI又不泄露客户隐私?
违反保密义务的风险是真实且严重的。2023年4月,一家律所律师将含客户商业机密的并购合同摘要输入公共版ChatGPT用于起草尽职调查清单,后因OpenAI明确告知用户输入可能被用于训练模型,导致客户拒绝继续委托。
我现在的做法是:严格遵循“三不输入”原则,不输入客户全名、不输入具体账户/合同金额、不输入构成商业秘密的技术参数。实操中,我将案情用代号替换(如“A公司与B公司签订采购合同,金额约100万,纠纷焦点为违约责任”),借助ChatGPT生成草案后,再手动替换真实信息。
对于敏感案件,我会使用企业版或本地部署的AI工具(如某些法律科技公司提供的私有化大模型),确保数据不出局域网。此外,每次使用前应在工作记录中注明“脱敏处理后使用AI辅助”,并主动向客户披露AI使用范围(征得同意)。记住:任何输入公共模型的信息,在法律上都不再受律师-客户保密特权的保护。
4. ChatGPT在法律文书润色和逻辑检查方面效果如何?有哪些常见陷阱?
我用ChatGPT来润色法律文书,但它有时会改变原意的表达。怎么用好它的润色功能,同时避免引入错误?
润色和法律逻辑检查是ChatGPT的弱项,但善用的话也能当得力助手。
我经历过一次惊险:将一份买卖合同中的“若甲方逾期付款,每日按欠付金额的千分之五支付违约金”交给ChatGPT润色,它直接改成了“千分之五的日利率”,这个表述会让法官和当事人理解成“日利率千分之五”(年化182.5%),远超法律保护的利率上限。
更隐蔽的是,它可能会悄悄调整句子的主被动语态,比如将“乙方有权单方解除合同”改为“合同可被乙方单方解除”,虽然意思相近,但在法庭上主动态更有气势。我的验证方法是:让ChatGPT同时输出原句和改写句的对比表格,并强制要求它解释每处修改的理由(如“避免歧义”“更符合法言法语”)。
对于逻辑检查,我会用两个提示词组合:第一,“找出这段文字中3个可能引发争议的漏洞”;第二,“从法院的角度,这段陈述中哪些事实最容易被对方律师攻击”。它的答案往往能提供线索,但绝不能替代人类律师的策略判断。
最稳妥的流程是:AI润色→人工逐句核对→朗读输出(用耳朵听比眼睛看更容易发现语病)→再请一位同事从对方视角读一遍。
核心关键词
文章版权归“万象方舟”www.vientianeark.cn所有。发布者:程, 沐沐,转载请注明出处:https://www.vientianeark.cn/p/597402/
温馨提示:文章由AI大模型生成,如有侵权,联系 mumuerchuan@gmail.com 删除。
读者评论
这篇文章把ChatGPT在法律文书辅助中的边界讲得非常透彻,尤其是“超级实习律师”这个定位,一下子就把AI能做什么、不能做什么说清楚了。我特别认同数据脱敏三原则,很多律师对隐私风险意识太弱,这个提醒非常及时。
关于“反方观点模拟”这个用法,确实是我目前见过最高价值的AI应用场景。能让AI站在对方律师视角找漏洞,比单纯让它生成文书更有战略意义,准备庭前工作时值得每个诉讼律师尝试。
作者提到的“幽灵法条”问题绝不是危言耸听。我在测试中也遇到过AI编造完全不存在的最高法判例,措辞之专业几乎以假乱真。核实环节不严,一份文书就可能让整个执业生涯翻车。
文中“不要编造具体法条”的提示词技巧非常实用,但有一点想补充:即使不给AI具体法条方向,它有时也会自动补充,所以事后逐条核对仍是不可或缺的步骤,不能完全依赖提示词的约束。